欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、智谱AI宣布开源「清影」同源视频生成模型——CogVideoX

智谱AI宣布开源了CogVideoX视频生成模型,旨在推动视频生成技术的发展和应用。该模型采用先进的大型模型技术,具备商业级应用需求,实现了高效的推理和微调,结合3D VAE技术和Transformer技术,生成高质量视频内容。智谱AI通过筛选高质量视频数据和处理视频字幕问题,确保模型训练数据质量。CogVideoX在性能评估方面表现优异,将继续探索视频生成领域的创新。

image

【AI摘要:】

⚙️ CogVideoX模型基于大型模型技术,满足商业级应用需求,推理和微调效率高

🔍 CogVideoX采用3D VAE技术和Transformer技术,生成高质量视频内容

📈 智谱AI通过筛选高质量视频数据和解决视频字幕问题,确保模型训练数据质量,性能评估优异

详情链接:https://github.com/THUDM/CogVideo

2、阿里通义App推出角色扮演功能

阿里通义App最新推出了创新的角色扮演功能,用户可一键替换视频中的人物。这一功能源自阿里通义实验室推出的Motionshop模型,吸引全球创作者关注。Motionshop已产品化并免费集成到通义App,拓展视频创作和动画制作领域。通义App将在9月推出自定义角色功能,丰富用户创作体验。

image

【AI摘要:】

🎭 角色扮演功能让用户一键替换视频人物,源自阿里通义实验室的Motionshop模型

🌐 Motionshop融合多种先进技术,允许用户在动态视频中实现现实与虚拟转换

💡 传统人物替换依赖路径追踪渲染,Motionshop提升效率并保持渲染质量

3、即梦视频生成推动效画板功能

即梦最新推出的动效画板功能让用户可以精确控制视频中物体的运动轨迹和结束状态,提升视频输出质量。这项功能支持框选或手动选择背景或主体,自动识别并节省用户时间。用户可以自由描绘运动轨迹,设置结束状态框位置,输出视频时长为4秒或6秒,创意无限。

【AI摘要:】

✨ 动效画板功能让用户精确控制视频物体运动轨迹和结束状态,提升输出质量。

🎨 支持自由描绘运动轨迹,设置结束状态框位置,创意表现更丰富。

⏱ 视频输出时长可选4秒或6秒,满足不同创作需求。

产品入口:soraor.com

详细内容点此查看:https://www.aibase.com/zh/news/10847

4、钉钉推出“AI 迎新百事通”:10分钟即可定制校园智能迎新助手

钉钉推出了名为“AI 迎新百事通”的智能化迎新解决方案,专为高校开学季设计,以提升新生入学的安全性和便捷性,并减轻教职员工的工作负担。该方案基于钉钉AI助理和知识库,能在10分钟内为学校定制一个全天候的智能迎新助手,7×24小时回答新生关于入学流程、校园生活和学习资源的问题。

image

【AI摘要:】

⭐ 高校开学季定制智能迎新助手,提升新生入学安全便捷,减轻教职员工工作负担。

⭐ 覆盖新生导入期、入校前、入校中、入校后四个关键阶段,提供全面迎新服务。

⭐ 体现数智化理念,预示高校数智化管理趋势,推动高等教育管理智能化、人性化发展。

详情链接:https://alidocs.dingtalk.com/notable/share/form/v01AJdl6406WLx2qke1dv19yqvsgs3oebp3pcjys1qX0QQ0?dontjump=true

5、月之暗面回应腾讯参与 Kimi3亿美元融资

这篇文章报道了腾讯参与中国人工智能独角兽企业月之暗面科技有限公司的融资事件,引起了关注。月之暗面作为大模型创业公司的佼佼者,由清华大学教授创立,汇聚了全球顶级人才和技术。公司融资规模巨大,股东包括阿里巴巴、红杉中国等知名机构。Kimi智能助手在国内AI聊天机器人中表现突出,访问量持续增长。

image

【AI摘要:】

🚀 月之暗面科技有限公司由清华大学教授创立,汇聚全球顶级人才和技术。

💰 公司融资规模巨大,腾讯参与的3亿美元融资引发关注,估值达到30亿美元。

🤖 Kimi智能助手在国内AI聊天机器人中表现突出,访问量持续增长,成为访问量第一的AI聊天机器人。

6、玩法升级!Runway Gen-3Alpha图生视频新增首尾帧功能

Runway在AI生成视频领域迈出重要一步,支持图像作为视频生成的首尾帧,提高艺术控制能力。这一功能解决了AI视频创作中的关键挑战,受到用户认可。Runway与其他竞争者竞争激烈,但公共可用性带来优势。新功能解决AI生成视频连贯性和艺术意图挑战,有望在商业应用中有重要价值。Runway正处关键时刻,谈判中或筹集巨额资金,技术意义深远,可能重塑行业。

【AI摘要:】

⚙️ 图像作为视频生成首尾帧,提高艺术控制能力

🔑 解决AI视频创作关键挑战,获得用户认可

💡 新功能有望在商业应用中有重要价值

详情链接:soraor.com

7、小米14、K70等将推澎湃OS全AI功能

小米公司宣布推出全新全AI功能,用户无需申请内测资格即可体验。全AI功能涵盖小爱输入助手、AI写真、AI搜图等多个方面。灰度测试将从本月开始,逐步推送至不同机型。暂时无法体验的用户需耐心等待。

【AI摘要:】

🚀 小米公司宣布推出全新全AI功能,用户无需申请内测资格即可体验。

🔍 全AI功能涵盖小爱输入助手、AI写真、AI搜图等多个方面。

📱 灰度测试将从本月开始,逐步推送至不同机型。暂时无法体验的用户需耐心等待。

8、ControlMM:文字、语音、音乐多模态输入生成全身动作

香港中文大学和腾讯联合推出的技术框架ControlMM实现了全身动作生成的新突破,支持多模态输入,解决了全身多模态运动生成中的诸多难题。通过创新方法和新基准的推出,ControlMM在各项标准运动生成任务中表现出色,具有优越的生成效果。

image

【AI摘要:】

🔥 多模态控制: ControlMM支持文本、语音、音乐等多种模态进行全身运动生成,增强了控制能力和适应性。

⚙️ 统一框架: 采用统一的ControlMM框架,整合了多种运动生成任务,提高了生成效率。

🎯 分阶段训练策略: 通过粗到细的训练策略,确保模型在不同粒度条件下的有效性。

详情链接:soraor.com

9、三星开始大规模生产用于设备端AI的内存芯片

三星宣布量产业内最薄的LPDDR5X DRAM芯片,厚度仅相当于指甲的薄度,以满足移动设备上的AI需求。新款内存不仅薄至0.65毫米,热阻性能提升21.2%,还展现出色的性能表现。三星计划扩大低功耗DRAM市场,推出更多高性能、高密度的内存解决方案。

【AI摘要:】

🌟 三星开始量产超薄LPDDR5X DRAM芯片,旨在满足移动设备上的AI需求。

📏 新款内存厚度仅0.65毫米,比前代产品更薄,热阻性能显著提升。

📈 三星计划扩大低功耗DRAM市场,推出更多高性能、高密度的内存解决方案。

10、英伟达被曝秘密抓取 YouTube 视频数据训练AI

英伟达近期被曝光秘密抓取大量YouTube视频数据用于训练人工智能模型,引发法律和伦理问题。管理层态度大胆自信,认为行为获得全面批准。谷歌指出未经许可使用YouTube数据违反服务条款,英伟达回应引发争议。

【AI摘要:】

📹 英伟达秘密抓取大量 YouTube 视频数据进行 AI 训练,法律和伦理问题引发关注。

💻 内部邮件显示,英伟达高管认为这一行为获得了全面批准,态度相当大胆。

📜 谷歌指出,未经许可使用 YouTube 数据明显违反平台服务条款,英伟达的回应引发争议。

11、AI芯片创业公司Groq获6.4亿美元融资 估值28亿美元

Groq成功获得6.4亿美元融资,估值达到28亿美元,意在挑战Nvidia的市场地位。该公司专注于开发语言处理单元(LPU),具备出色的处理速度和能源效率。Groq积极拓展市场,与多家公司建立合作关系,努力成为AI芯片行业的有力竞争者。

【AI摘要:】

🌟 Groq获得6.4亿美元融资,估值28亿美元,意在挑战Nvidia的市场地位。

⚡ Groq的语言处理单元(LPU)专为AI工作负载设计,具备出色的处理速度和能源效率。

🌍 Groq积极布局政府和国际市场,与多家公司建立合作关系,扩展市场影响力。

12、苹果AI功能指令曝光 揭示iOS和macOS未来AI助手细节

苹果公司最新开发者测试版加入多项生成式AI功能,包括邮件助手、文本重写、邮件摘要、照片回忆和消息总结。这些功能揭示了苹果未来AI助手的工作方式,但用户需谨慎探索敏感区域。iOS和macOS新版本推出后,将体验这些AI功能。

image

【AI摘要:】

📧 邮件助手:AI根据邮件内容提出问题,可能智能回复一部分。

📝 文本重写:AI限制回答在50字内,禁止幻觉或编造事实。

📬 邮件摘要:AI用三句话不超过60字总结邮件内容,不回答问题。

13、OpenAI领导层大动荡!两个联合创始人一个离职、一个延长休假

OpenAI的管理层出现重大变动,总裁兼联合创始人Greg Brockman宣布休假至年底,另一联合创始人John Schulman加入竞争对手Anthropic。这一变动意味着公司经历新的调整,尤其在经历多次高管变动后。

【AI摘要:】

🌟 Greg Brockman宣布休假至年底,Schulman转投竞争对手Anthropic。

🚀 今年以来OpenAI管理层变动频繁,已离职多名高管。

💡 Schulman被誉为ChatGPT的“设计师”,但他表示这要归功于整个团队的努力。

14、零一万物01AI旗下Yi API宣布 Function Call 功能上线

Yi API推出具有Function Call功能的Yi-Large-FC模型,实现平滑替代GPT的能力,对构建AI Agent系统至关重要,展现高性能在API调用场景中的表现。Yi系列大模型已成为企业探索新业务和验证AI-first产品的首选。零一万物持续推出新工具,如RAG和Function Call,提供更易用、更深入、更安全稳定的解决方案。

image

【AI摘要:】

🚀 Yi-Large-FC模型具有Function Call功能,可根据用户输入判断何时调用外部工具,并以JSON格式响应,兼容OpenAI接口设计,实现平滑替代GPT的能力。

💡 Function Call能力对于构建AI Agent系统至关重要,特别适用于实时信息处理、专用任务处理、自动化工作流程和增强模型能力的场景。

💼 Yi-Large-FC在BFCL排名全球第六,在Exec摘要得分排行中位列世界第二,展现出在实际API调用场景中的高性能