首页  >  全球资讯 >  深度分析 >  台湾地区禁止公务机关使用DeepSeek 蒸馏提炼引发质疑
台湾地区禁止公务机关使用DeepSeek 蒸馏提炼引发质疑
陆一夫 来源: 2025-02-04 04:28
        
重点摘要
中国生成式AI工具DeepSeek 引发全球关注之后,中国台湾地区政府周五发出警示,公务机关与关键基础设施应限制使用DeepSeek,以保障当地的资讯安全

中国生成式AI工具DeepSeek 引发全球关注之后,中国台湾地区政府周五发出警示,公务机关与关键基础设施应限制使用DeepSeek,以保障当地的资讯安全。

DeepSeek最新AI模型“价廉物美”,引发科技界震荡。但OpenAI本周三称,有证据表明DeepSeek使用OpenAI专有模型来训练自己的模型,并暗示这可能违反了OpenAI服务条款。美商务部长提名人卢特尼克指责DeepSeek似乎盗用了美国的人工智能技术。新闻可靠性评级机构NewsGuard 称,Deepseek-V3识别假新闻只有17%的准确率。

台湾地区数位发展部周五表示,基于国家资通安全考量,特别警示公务机关与关键基础设施应限制使用DeepSeek AI产品,以避免使用者相关数据或资讯被有资安疑虑的产品传送。

路透社指出,台湾长期以来一直对中国技术保持警惕,因为北京对该岛宣称拥有主权并一直对其保持军事和政治威胁。

台湾地区数位发展部强调,DeepSeek AI服务为中国产品,运行涉跨境传输及资讯外泄等资安疑虑,属危害国家资通安全产品。

该部还表示,将持续掌握相关技术发展,并适时调整资安政策,以保障国家资讯安全。

本周五,韩国信息隐私监管机构也表示,计划向DeepSeek询问其如何管理用户的个人信息。

法国、意大利、爱尔兰等国的当局也在调查DeepSeek对个人数据的使用情况。

截至周一,DeepSeek的免费人工智能助手在苹果应用商店的下载量已超过美国竞争对手ChatGP,全球投资者抛售美国科技股,芯片制造商英伟达( Nvidia)的市值蒸发5930 亿美元,创下华尔街任何公司单日亏损纪录。

对DeepSeek成本与芯片的质疑

不过,在一些媒体和专家把DeepSeek的“横空出世”称为AI界的“史普尼克时刻”之际,也有声音质疑DeepSeek所公布的开发成本以及所用芯片的规格与数量。

上周,美国人工智能数据服务公司Scale AI首席执行官汪滔 (Alexandr Wang) 在接受 CNBC 采访时对 DeepSeek的说法表示怀疑,称“这款产品的背后,可能使用了数万颗Nvidia(英伟达)的H100芯片”。他说,“DeepSeek显然拥有50,000颗H100芯片,但他们显然不能公开这些信息,因为那会违反美国的出口管制。”汪滔没有为他的说法提供证据。

亿万富翁埃隆·马斯克支持对DeepSeek持怀疑态度的人。他在X上有关Alexandr Wang上述说法的帖子下跟帖写道:“显然”(Obviously)。

英伟达(Nvidia)的H100芯片是目前市场上最先进的AI训练芯片之一,但根据美国政府的出口管制政策,H100芯片是不能向中国公司销售的。

DeepSeek蒸馏提炼违反OpenAI条款?

DeepSeek也被一些技术专家怀疑其模型可能从美国先进的模型中学习到了部分成果,即采用了所谓的“蒸馏技术”。该技术是指通过从更成熟、更强大的人工智能模型中提炼数据来训练新的AI模型,由旧模型评估新模型得出的答案的质量,从而有效地转移旧模型所掌握的学习成果。这意味着新模型可以从旧模型中获益,而无需承担构建旧模型所投入的大量时间、算力等成本。

1月29日,OpenAI称,发现有证据表明DeepSeek使用OpenAI的专有模型来训练自己的模型,并暗示这可能违反了OpenAI的服务条款。不过,OpenAI没有进一步列举掌握了哪些证据。OpenAI的服务条款规定,用户可以使用OpenAI的API输出接口将其AI技术与自己的应用程序相结合,但禁止用户“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。用蒸馏输出构建竞争模型涉嫌违反 OpenAI服务条款。OpenAI表示,它将与美国政府合作保护美国技术,但没有详细说明如何合作。

专家:阻止“蒸馏”非常困难

技术专家表示,阻止模型蒸馏可能非常困难,甚至不可能。

人工智能计算公司Groq的首席执行官乔纳森·罗斯 (Jonathan Ross) 表示,该公司已采取措施阻止所有中国IP地址访问其云端存储,以阻止中国公司利用其托管存储的人工智能模型。但是,“这是不够的,因为人们可以找到绕过它的方法”,罗斯说。“这将是一场猫捉老鼠的游戏……我不知道解决方案是什么。如果有人想出办法,请告诉我们,我们会实施。”

DeepSeek的一项创新是开辟了从一个更大、更强大的模型中获取相对较少的数据样本(不到一百万个)来显著提高较小模型能力的思路。这一新思路可能引来大量初创公司的效仿。

DeepSeek的数据保护引发担忧

德国数据保护机构则希望对DeepSeek在数据保护方面的问题进行审查。DeepSeek的数据保护指南规定,该应用程序会收集大量信息——从IP地址、聊天记录到上传的文件,甚至按键的模式和节奏。鉴于成百上千万人的数据面临高风险,德国有关当局希望了解“哪些个人数据是从哪些来源收集的,以及用于什么目的”。

就在本周三,以色列网络安全公司Wiz发现DeepSeek发生数据泄露。超过一百万条数据记录,包括数字软件密钥和聊天记录,被意外地暴露在不安全的互联网上。这些敏感数据还包括用户对免费AI助手的请求。Wiz联合创始人鲁特瓦克(Ami Luttwak) 称,DeepSeek 立即做出了回应, “在不到一小时的时间内就将其删除。”不过,卢特瓦克表示,“这些数据那么容易被找到,我们相信我们不是唯一发现它的人。”

相关资讯
标签: deepseek台湾OpenAI