7月23日,Meta 发布了旗下最新开源模型 Llama 3.1,包含 8B、70B 和 405B 这三个参数规模。尽管新版本存在许多问题,但仍然受到科技业者的追捧。
迄今为止,Llama 的总下载量已超过三亿次。运行在超过7000万台的终端平台上。Meta 的 CEO 马克·扎克伯格称 Llama 3.1 的出现“将成为行业的一个转折点”,并坚信开源是语言大模型未来发展的方向。
最新版本的 Llama 3.1 对内核代码进行了重大更新,支持八种语言的对话、编写和运行更有效率,目前 Llama 3.1 模型已被用于Meta的聊天机器人上,该产品已加入 Instagram 和 WhatsApp 等应用程序。
根据测试后的反馈,Llama 3.1 405B 版本的表现在某些方面超越了 OpenAI 的 GPT-4.0,这得益于其海量15亿次 Token 的数据训练,并把模型算力规模首次扩展到了超过16000个英伟达 H100 GPU。
同时,扎克伯格希望能快速的的拓宽 Llama 3.1 的生态圈,目前在超过25个企业的平台上推出,包括亚马逊云科技、微软云 Azure、谷歌云、Oracle 等主要云平台。Meta 表示,未来,不仅仅是语言,图像、视频和语音功能都会整合到 Llama 中,使模型能够识别图像和视频,并通过语音支持交互。
7月23日当天,扎克伯格在标题为《开源 AI 是前进之路》的文章中,将 Llama 3.1 称为“行业的一个转折点”,表达了对 Meta 在人工智能方面的勃勃雄心,同时也表达了对中美在 AI 竞争方面的担忧:
“‘美国在 AI 发展方面能够永远领先中国5到10年’的观点是不现实的,在 AI 竞赛中对中国封锁是大错特错,我觉得这方面差距大概也只有6至8个月。”
目前,中国大概有305个 AI 大模型,其中超过半数的大模型都是开源的,而作为全球拥有 AI 大模型数量最多的国家,每月使用的用户数量却不足1500万,用户数最大的文心一言的月度活跃人数不到750万。而其中的有效使用率一半都不到。
扎克伯格对中国的 AI 大模型传达出了乐观的态度,中国的业者普遍担忧技术、成本和市场的内卷可能会损耗在国际的竞争力。虽然国内的语言大模型在推理、数学、代码和智能体方面表现给力,但在自主性思维、艺术性和想象力表达等方面仍有差距。
从市场表现来看,国内的语言大模型在上下游议价能力和同产品替代性等方面都不具有优势,而面对技术的不完美而过度去追求市占率,很难让人有比较乐观的预期。