中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI大规模语言模型(LLM)近日引发全球关注。日本AI研究领域的权威、东京大学教授松尾丰在接受日本经济新闻采访时,对DeepSeek的技术水平、开源战略及其对日本企业的影响进行了深入分析。

松尾丰表示,DeepSeek的技术非常出色,其性能与美国OpenAI开发的ChatGPT接近。他指出,DeepSeek每次发布新模型时都会发布详细的技术论文,展示其在模型优化方面的创新之处。例如,今年1月发布的最新模型“R1”通过强化学习提升了推理能力,达到了与OpenAI“o1”模型相当的水平。

image

松尾丰认为,中国的AI开发水平已经与美国比肩,甚至在某些方面超越了美国。他指出,中国不仅有阿里巴巴、腾讯、百度等科技巨头,还拥有大量优秀工程师,形成了活跃的AI生态系统。DeepSeek在这样的环境中崛起并不令人意外,并可能进一步改变全球AI竞争的势力格局。

松尾丰强调,DeepSeek的成功为日本初创企业提供了重要启示。作为一家非大型科技企业,DeepSeek凭借扎实的技术开发实现了世界领先的精度。这表明,即便在日本,只要专注于技术创新,企业同样有机会在AI领域取得突破。

DeepSeek采取了开源战略,这一做法与Meta和阿里巴巴等企业类似。松尾丰指出,开源模型为全球开发者提供了强大的基础,使追加学习和性能提升变得更加容易。他认为,DeepSeek的出现增强了开源势力的影响力,尽管非公开模型(如OpenAI和谷歌的产品)仍具备竞争优势,但开源模型在特定场景下同样能够实现卓越性能。

关于AI模型的安全风险,松尾丰表示,风险因使用方式而异。开源模型可以在本地运行,避免了数据外泄的风险;而使用在线服务时,数据会发送到服务器进行处理。他强调,无论是DeepSeek还是OpenAI,用户都需要对服务提供方保持信任,因为数据的使用和学习难以完全排除。