信息差

AI日报：GPT-4o加持！苹果全线产品进入生成式AI时代；腾讯支持生成多人视频；ChatGPT语音功能升级

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、苹果WWDC放出深水炸弹 GPT-4o加持Siri 全家桶都上生成式AI

苹果在2024年的全球开发者大会WWDC上宣布了全线产品进入生成式AI时代，推出了全新个性化智能系统Apple Intelligence。更新核心是结合生成式AI模型和用户资料的智能服务，深度集成在iOS18、iPadOS18和macOS Sequoia中。Siri变革，具备更丰富语言理解能力和跨应用执行操作。系统集成ChatGPT提供图像和文档理解功能，新增写作工具和Image Playground等功能。

【AI摘要:】

🍎 Apple Intelligence整合生成式AI模型和用户资料，提供实用智能服务，深度集成在iOS18、iPadOS18和macOS Sequoia中。

🤖 Siri变革，拥有更丰富语言理解能力，支持跨应用执行操作，用户可通过打字与Siri交流。

📸 系统集成ChatGPT提供图像和文档理解功能，新增写作工具和Image Playground，用户可创建动画、插图或素描风格的图像。

详情：https://www.chinaz.com/2024/0611/1622511.shtml

2、苹果与谷歌 Gemini 模型合作

苹果宣布与谷歌的 Gemini 模型合作，开放第三方模型接入，为用户提供更多选择。Siri 将整合 ChatGPT，用户可在不离开 Siri 的情况下进行会话，并保持隐私控制。苹果更新开发工具包，首次接入 OpenAI 的 ChatGPT，同时发布一系列新特性和更新。

【AI摘要:】

🍎 苹果与谷歌 Gemini 模型合作，开放第三方模型接入，拓展人工智能生态系统。

🤖 Siri整合ChatGPT，用户可在Siri内进行会话，保持隐私控制。

🚀 苹果更新开发工具包，首次接入OpenAI的ChatGPT，发布iOS18新特性和VisionOS2。

3、iOS18 相册APP大改版：新增AI消除智能筛查缩小搜索范围

苹果在最新发布的iOS18 系统中，对短信功能进行了全面革新。用户不仅可以为短信内容添加下划线和删除线能应用一系列动态文字效果，让每一条信息都充满个性。

【AI摘要：】

⭐️ 苹果与OpenAI达成合作协议，iOS18 将引入ChatGPT功能。

🤖 GPT- 4 生成的叙述见解对未来股票表现具有信息性。

💬 iPadOS18 系统不仅支持iOS18 上各种自定义功能之外支持自定义应用内的常用功能栏。

iOS18 升级适配机型点此查看：https://www.chinaz.com/2024/0611/1622488.shtml

4、腾讯推全新图生视频模型Follow-Your-Pose-v2

这篇文章介绍了腾讯混元团队联合中山大学、香港科技大学推出的全新图生视频模型"Follow-Your-Pose-v2"，实现了多人视频动作生成、强泛化能力和正确处理人物遮挡等亮点。该模型在视频生成领域具有重要意义，应用前景广阔。

【AI摘要:】

🌟 支持多人视频动作生成，实现多人视频动作的生成，推理耗时更少

🔥 强泛化能力，无论年龄、服装、人种、背景杂乱程度或动作复杂性如何，都能生成高质量视频

💡 正确处理人物遮挡，能生成具有正确前后关系的遮挡画面

项目页:soraor.com

论文地址:https://arxiv.org/pdf/2406.03035

5、MotionFollower:在不改变视频背景的情况复刻人物动作

MotionFollower是一项创新技术，能够将一个视频中的运动复制到另一个视频中的人物上，保持人物外观不变。这项技术应用广泛，可用于电影制作、广告创作、游戏开发等领域。

【AI摘要:】

⚙️ MotionFollower是创新技术，将视频中的运动复制到另一个人物上，保持外观不变。

🌐 应用场景广泛，可用于电影、广告、游戏等领域。

🎥 MotionFollower处理大范围相机运动视频，实现高质量运动信息转移。

详情链接:soraor.com

6、Adobe修订服务条款，明确不会用客户作品进行AI训练

Adobe宣布重新修订服务条款，澄清不会用客户作品进行AI训练，目的是赢回用户的信任。这一变化是在一周前的用户强烈抗议后宣布的。

【AI摘要:】

🛡️ Adobe 修订服务条款，澄清不会用客户作品进行 AI 训练

💬 Adobe 总裁承认应及早澄清服务条款，表示将更加透明

🖼️ 创作者对 Adobe 的担忧仍存，公司努力赢回信任

7、OpenAI升级ChatGPT语音功能使其能够以不同角色的声音说话

OpenAI最新更新了ChatGPT的语音功能，允许用户与聊天机器人交互使用各种AI生成的声音和声音风格。新功能让用户指示AI聊天机器人使用任何语音实时做出响应，提升了互动性和可访问性。

【AI摘要:】

🔊 ChatGPT现有四种预设声音，可实时优化声音风格。

🗣️ 用户可以要求AI为故事中的角色配音，生成独特声音，如狮子的轰隆隆声。

🔜 OpenAI将在未来几周内推出新的语音功能，提供给所有ChatGPT用户，高级订阅者可优先使用。

8、秒杀Instant3D!上交大推新框架Bootstrap3D 显著提升3D生成能力

上海交大和香港中文大学的研究团队推出了名为Bootstrap3D的新框架，通过结合微调的3D感知多模态大模型，能自动生成高质量多视角图片数据，显著提升3D生成模型的能力。框架的合成数据集已全面开源，供研究人员和开发者免费使用。该框架的关键特点包括数据构建Pipeline、文本提示生成、图像生成、多视图合成、质量筛选和描述重写等。研究团队还提出了训练timestep重安排（TTR）策略，优化去噪过程的不同阶段，解决多视图扩散模型训练中的问题。实验结果表明，使用TTR策略的多视图扩散模型在图像-文本对齐、图像质量和视图一致性方面表现优异，有效提升了多视图生成的效果。

【AI摘要:】

🔑 数据构建Pipeline: 自动生成多视角图像数据和详细描述文本，是框架的核心创新之一。

🔑 文本提示生成: 使用大语言模型生成创意和多样化的文本提示，为图像生成提供素材。

🔑 多视图合成: 将单视图图像扩展为多视角图像，确保不同视角下的一致性。

详情链接:soraor.com

9、谷歌推出AGREE框架增强大型语言模型生成内容准确性

谷歌研究院推出AGREE框架，旨在增强大型语言模型生成内容和引用的准确性。该框架通过检索相关段落来提高回答准确性，并为用户提供验证信息真实性的途径。核心技术包括训练阶段微调和测试时自适应。实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出。

【AI摘要:】

🔍 AGREE框架旨在增强大型语言模型生成内容和引用的准确性

🎯 核心技术包括训练阶段微调和测试时自适应

💡 实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出

详情链接:https://arxiv.org/pdf/2311.09533

10、粉笔将于 8 月推出自研AI智能老师

粉笔集团将于 2024 年 8 月推出自研AI智能老师，成为其线上平台提供的AI学习工具之一，首先应用于国家或省级招录类及资格证考试系统班。

【AIBase提要：】

⭐️ 粉笔集团将于 2024 年 8 月推出自研AI智能老师。

⭐️ AI智能老师将成为粉笔线上平台提供的AI学习工具之一。

⭐️ 首先应用于国家或省级招录类及资格证考试系统班。

如果觉得文章对你有用，请随意赞赏

快讯

AI日报：GPT-4o加持！苹果全线产品进入生成式AI时代；腾讯支持生成多人视频；ChatGPT语音功能升级

https://soraor.com/archives/ai-today_20240612102638

作者

破晓

发布于

2024-06-12

更新于

2024-06-12

许可协议

CC BY 4.0