阿里全新发布QVQ-72B多模态推理模型:视觉语言双料俱佳,高效破解复杂难题

阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。 QVQ-72B在视觉推理、数学和科学问题上表现出了显著的提升,尤其是在多步推理任务中。这

GE医疗携手AWS构建首个全身3D MRI模型,助力精准医学影像解析

MRI 图像因其复杂性和数据量大,一直以来都是医学影像分析中的一大挑战。为了训练大型语言模型(LLM)进行 MRI 分析,开发者不得不将获取的图像切割为2D 图像,这样的处理虽然可行,但却限制了模型对复杂解剖结构的分析能力,尤其是在脑肿瘤、骨骼疾病或心血管疾病等复杂案例中。 图源备注:图片由AI生成

白宫迎AI专家!特朗普重塑美国科技政策团队

美国科技政策领域正迎来重大调整。近日,斯坦福大学人类中心人工智能研究院(Stanford HAI)的研究员Michael Kratsios被任命为白宫科技政策办公室主任,同时还将担任即将上任的特朗普政府的总统科技助理。这一任命引发了广泛关注,标志着美国AI高层研究者对国家科技政策的影响力日益增强。

错字也能“解锁”GPT-4o、Claude:揭示AI聊天机器人的漏洞!

近期的研究表明,市场上最先进的 AI 聊天机器人竟然对一些简单的技巧十分敏感,甚至可以被轻易 “越狱”。根据《404媒体》的报道,Claude 聊天机器人的开发公司 Anthropic 发现,只需在提示中故意加入一些拼写错误,便能使这些大型语言模型忽视自身的安全防护措施,生成一些本应拒绝回答的内容。

OpenAI或亲自操刀研发人形机器人

快科技12月25日消息,据报道,有知情人士透露,人工智能初创公司OpenAI近期考虑了制造能够执行多种任务的人形机器人的可能性。 在过去的一年间,OpenAI不仅重启了四年前解散的内部机器人软件专项团队,还积极投资于专注机器人软硬件开发的初创企业,如Figure与Physical Intellige

谷歌Gemini“借鉴”竞品Claude引争议,合规性受质疑

科技巨头们在AI领域的竞争日趋白热化,而最近曝光的一则消息再次将行业竞争的暗流涌动推向了台前。据TechCrunch获得的内部通信内容显示,负责改进谷歌Gemini人工智能模型的承包商,竟然在将其答案与Anthropic的竞品模型Claude的输出进行比较。此举引发了外界对于谷歌是否获得Anthro

研究揭示:OpenAI 的 o1-preview 在诊断复杂医疗病例上胜过专业医生

一项新研究表明,OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗案例方面,可能优于人类医生。哈佛医学院和斯坦福大学的研究团队对 o1-preview 进行了全面的医疗诊断测试,结果显示该系统相比于早期版本有了显著进步。 根据研究结果,o1-preview 在所有被测试的病例中,正确

AI“艺术家”惊艳亮相!作品拍出数百万美元,震撼颠覆传统艺术圈

艺术的未来或许不再仅仅属于人类。今年,人工智能(AI)的应用已经渗透到全球数百万人的日常生活中,从科幻概念变成了简化日常活动、优化用户时间的实用工具。如今,一种新的现象正在兴起:AI“艺术家”通过“创作出比人类更有趣的作品”筹集了数百万美元,这无疑将颠覆传统的艺术创作模式。 一个名为Botto的开创

广告巨头热拥AI!可口可乐引领人工智能营销新潮

生成式人工智能(AI)与营销科学的融合正在彻底改变广告行业。尽管仍存在一些犹豫,但越来越多的品牌开始认识到AI在创意和运营方面的巨大潜力。可口可乐等知名品牌已经率先将AI融入广告活动中。 可口可乐利用AI重制其标志性广告“The Holidays are Coming”,展示了在短时间内取得的技术进

尴尬曝光!谷歌利用Claude模型进行对比测试 以提升Gemini AI性能

近日,谷歌的 Gemini 人工智能项目正在通过比较其输出结果与 Anthropic 公司的 Claude 模型来提升自身性能。据 TechCrunch 获得的内部通信记录显示,负责 Gemini 改进的承包商正在系统地评估这两种 AI 模型的回答。 图源备注:图片由AI生成,图片授权服务商Midj