苹果“多模态炼丹炉”再进化:MM1.5版强化文本密集与多图理解能力

苹果公司最近为其多模态人工智能模型MM1推出了重大更新,将其升级为MM1.5版本。这次升级不仅仅是简单的版本号变更,而是全方位的能力提升,使得模型在各个领域都展现出了更强大的性能。 MM1.5的核心升级在于其创新的数据处理方法。该模型采用了以数据为中心的训练方法,精心筛选和优化了训练数据集。具体而言

OpenAI积极应对:马斯克第二起诉讼胜算甚微,遭后者行动驳回

近日,马斯克与他曾参与创办的人工智能公司 OpenAI 之间的法律争斗愈演愈烈。马斯克对 OpenAI 提起的第二次诉讼看起来并不乐观,他声称这家原本旨在造福人类的非营利机构,非法转变为一家盈利公司,违背了其创立时的宗旨。 图源备注:图片由AI生成,图片授权服务商Midjourney 马斯克试图要求

科斯拉资本大举注资OpenAI:4.05亿美元换取6%股份,助力ChatGPT背后力量

根据最新监管文件披露,著名投资机构科斯拉创投(Khosla Ventures)为人工智能公司OpenAI筹集了4.05亿美元资金。这一数字占OpenAI近期完成的66亿美元融资总额的约6%,彰显了科斯拉在ChatGPT开发商中的重要地位。 科斯拉创投由硅谷传奇人物维诺德·科斯拉(Vinod Khos

仅需1%合成数据即可引发大模型崩溃,Meta团队研究揭示其毒性

最近AI圈子发生了一件怪事,就像一个吃播博主突然开始吃自己做的菜,而且越吃越上瘾,菜也越来越难吃。这事儿说起来还挺吓人,专业的术语叫模型崩溃(model collapse)。 模型崩溃是啥?简单来说,就是AI模型在训练过程中,如果大量使用自己生成的数据,就会陷入一个恶性循环,导致模型生成的质量越来越

Meta宣称AI拍摄北极光照片与真实景观相媲美,引发网友不满

Meta最近发布了一条帖子,建议人们使用人工智能来伪造北极光照片。然而,这条帖子却引起了网友的愤怒和批评。许多人认为,人工智能生成的照片无法取代真实的生活体验和共同的庆祝活动。 图片显示北极光盘旋在金门大桥、城市天际线和摩天轮上空。这显然是为了抓住人们上传自己在周四晚上深入美国境内的北极光奇观中拍摄

AI搜索引擎崭露头角,谷歌美国搜索广告市场占比或跌破50%大关

最近有消息指出,谷歌在美国的搜索广告市场份额可能会在2025年跌破50%,这也是谷歌十多來首次跌破50%。这一变化标志着谷歌在这个近3000亿美元的市场上长期以来的主导地位面临重大挑战。 根据《华尔街日报》的报道,诸如 TikTok、亚马逊以及人工智能初创公司 Perplexity 等新兴竞争者正不

苹果计划明年推出定价2000美元的Vision头戴式设备

苹果公司正在继续推进其混合现实计划,尽管其之前的 Vision Pro 头戴设备并没有取得巨大的成功。根据彭博社的报道,苹果计划在明年推出一款新型的 Vision 头显,售价约为2,000美元。与之前的 Vision Pro 相比,这款新设备将使用更便宜的材料和性能更低的处理器,并且不会包含 Eye

OCR 2.0技术升级:一键转换图像中的文本、公式与图表为可编辑格式

在数字化时代,将图像中的文字内容快速转换成可编辑文本是一个常见且重要的需求。现在,一项名为GOT(通用光学字符识别理论)的新型光学字符识别(OCR)模型的问世,标志着OCR技术迈入了2.0时代。这一创新模型结合了传统OCR系统与大型语言模型的优势,旨在打造一个更高效、更智能的文本识别工具。 GOT模