CogAgent-9B:基于屏幕截图预判操作的智谱AI开源Agent任务模型

智谱AI旗下的GLM-PC基座模型CogAgent-9B现已开源,以促进大模型Agent生态的发展。CogAgent-9B是基于GLM-4V-9B训练而成的专用Agent任务模型,能够仅通过屏幕截图作为输入,根据用户指定的任意任务结合历史操作,预测下一步的GUI操作。这一模型的普适性使其可广泛应用于

广汽推出第三代人形机器人GoMate,预计2026年实现量产

广汽集团在2024年中国机器人网年会上发布第三代具身智能人形机器人GoMate,展现了汽车制造商向机器人领域拓展的新布局。 这款机器人最大亮点是采用行业首创的可变轮足移动结构,能够在四轮足、两轮足两种模式间自由切换,大幅提升环境适应能力。搭载广汽自研的纯视觉自动驾驶算法和FIGS-SLAM算法架构,

DeepSeek-V3震撼发布:开源AI巨兽性能赶超Llama与Qwen

2024年12月26日,中国人工智能初创公司DeepSeek发布了其最新的超大模型DeepSeek-V3,这一模型以其开放源代码技术和创新挑战领先AI供应商而闻名。 DeepSeek-V3拥有671B个参数,并采用专家混合架构(mixture-of-experts architecture)来激活特

攀登开源AI新巅峰:DeepSeek V3力压Llama3.1,训练数据量达14.8万亿token

中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。 DeepSeek V3的突出特点在于其强大的性能与高效的开发过程。

再陷困境?OpenAI的ChatGPT与Sora本月二度宕机

美国当地时间周四,ChatGPT、Sora以及OpenAI面向开发者的API服务再次遭遇宕机,持续时间超过四个小时。OpenAI表示,从上午11点(本文时间所指的都是美国当地时间)开始遭遇重大中断,但截至下午3点16分,服务正在逐步恢复。经常使用ChatGPT的用户可能还记得,本月早些时候服务也曾中

报告揭示:微软与OpenAI基于财务利润界定AGI

根据The Information的最新报告,微软和OpenAI对人工通用智能(AGI)有一个非常具体且内部的定义,这个定义基于初创公司的利润。根据这一定义,OpenAI距离实现AGI还有好几年的时间。 图源备注:图片由AI生成,图片授权服务商Midjourney 据报道,这两家公司去年签署了一项协

AI赋能:助老安全独立生活新篇章

随着科技的不断进步,人工智能(AI)技术已成为提升老年人生活质量的关键。据调查显示,92%的老年人希望在自己的家中度过晚年,AI技术的介入,不仅保障了他们的安全,也维护了他们的独立性。面对老年人独自在家时可能发生的紧急情况,如跌倒、中风或心脏病发作,AI提供了有效的解决方案。 在跌倒检测方面,AI算

香港AI初创进军企业活动领域!个性化头像生成服务收益丰厚

一家总部位于香港的初创公司Pons.ai,正利用生成式人工智能(AI)技术设计个性化头像,并计划在企业活动领域大展拳脚。在企业纷纷探索AI商业化途径并应对地缘政治不确定性挑战之际,Pons.ai的出现无疑为行业带来了新的思路。 图源备注:图片由AI生成,图片授权服务商Midjourney Pons.