欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:soraor.com
1、OpenAI推ChatGPT高级语音模式,新增五种声音风格
OpenAI宣布推出全新的高级语音模式,为ChatGPT Plus和Team用户提供个性化交流体验。用户可选择五种声音风格和语速,支持多达50种语言,提升了语音交流的流畅度和个性化。新功能让ChatGPT在教育、法律、商务和医疗等领域的应用更加广泛,为用户带来更好的体验。
【AI摘要:】
🎤 开放高级语音模式:支持多达50种语言,提供个性化交流体验。
🎶 自定义互动:用户可选择五种声音风格和语速,个性化交流更加灵活。
🌍 广泛应用场景:语音模式在教育、法律、商务和医疗领域有着广泛的应用,提升用户体验。
2、谷歌Gemini1.5升级:性能暴涨,价格腰斩
谷歌今日宣布推出全新升级的Gemini模型系列,包括Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。这次更新不仅大幅提升了性能,还带来了令人惊喜的价格优惠,无疑将在AI开发圈掀起一阵热潮。Gemini1.5升级为开发者带来了更高的性能和更低的成本,同时提供更多选择和灵活性。
【AI摘要:】
✨ 价格大幅下调,性能显著提升,开发效率大幅提高
⚙️ 新版Gemini模型在数学、长文本处理和视觉任务上全面提升
💡 Gemini1.5Pro的长文本处理能力和多模态能力开启全新应用场景
详情链接:https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/
3、阿里新技术MIMO:一张图片+视频 纸片人瞬间变动漫男神
阿里巴巴集团智能计算研究院推出的MIMO技术彻底改变了动画角色创作方式。只需一张静态图片和简单动作指令,即可转化为可操控的虚拟角色,无论真人、卡通还是拟人化角色。MIMO操作简便高效,无需多角度拍摄或单独训练角色,融合2D视频信息和3D空间建模。应用范围广泛,能提取复杂动作并实现真实场景互动,降低动画制作门槛,增强动画真实感和沉浸感。
【AI摘要:】
🎨 创新工具MIMO彻底改变动画角色创作方式,简单静态图片和动作指令即可转化为可操控虚拟角色。
🔄 MIMO操作简便高效,无需多角度拍摄或单独训练角色,融合2D视频信息和3D空间建模。
🌐 应用范围广泛,能提取复杂动作并实现真实场景互动,降低动画制作门槛,增强动画真实感和沉浸感。
详情链接:https://menyifang.github.io/projects/MIMO/index.html
4、讯飞星火API全新升级:Lite版永久免费 Max版可免费领1亿Tokens
科大讯飞讯飞开放平台宣布讯飞星火API平台实现重大升级,包括Spark Max模型和4.0Ultra模型,提升了生成速度、逻辑推理、创作能力和联网搜索等关键性能。升级后的模型在逻辑推理方面表现更快更准确,在创作方面生成具有逻辑性和实用性的文章,支持长文本任务处理,价格不变且提供免费Lite版本和优惠活动。性能全面升级,超越国际领先的GPT-4Turbo。
【AI摘要:】
🚀 提升生成速度和关键性能,包括逻辑推理、创作能力和联网搜索。
💡 模型在逻辑推理方面表现更快更准确,能提供详细推理过程。
📝 新模型生成具有逻辑性和实用性的文章,支持处理长文本任务,价格不变且提供免费Lite版本和优惠活动。
详情链接:https://xinghuo.xfyun.cn/sparkapi
5、谷歌新语音克隆技术:仅需几秒钟音频样本,即可实现声音克隆
在科技迅猛发展的今天,谷歌研究人员提出了零样本语音转换技术,帮助失声人士找回声音记忆。该技术具有零样本能力,支持多语言声音转换,展示了强大的适应性和实用性。通过短时间音频样本,成功合成特殊发音者的语音,大大丰富了语音交流的可能性。
【AI摘要:】
🎤 零本语音转换技术:无需大量样本,帮助失声人士找回声音。
🌍 语言能力:实现不同语言之间的声音转换,丰富了语音交流的可能性。
🗣️ 特殊发音者的应用:通过短时间的声音样本,成功合成特殊发音者的语音,展示了技术的适应性与灵活性。
详情链接:https://google.github.io/tacotron/publications/zeroshotvoice_transfer/
6、生数科技视频生成模型Vidu开放API
在百度云智大会上,生数科技宣布旗下视频大模型Vidu正式开放API并接入百度智能云千帆大模型平台,成为首个视频大模型。Vidu具备高动态性、多风格化和极致推理等领先优势,解决了视频模型一致性生成难题,预计加速影视、动画、广告等行业的视频创作。
【AI摘要:】
🚀 Vidu开放API并接入百度智能云千帆大模型平台,成为首个视频大模型。
💡 Vidu具备高动态性、多风格化和极致推理等领先优势,解决了视频模型一致性生成难题。
💼 Vidu预计加速影视、动画、广告等行业的视频创作,降低成本、提升效率,激发创新思维。
7、大跨界!《泰坦尼克号》导演詹姆斯 · 卡梅隆加入 Stability AI 董事会
詹姆斯・卡梅隆加入 Stability AI 董事会引发影视行业轰动,将AI技术与电影艺术结合,开启创新故事讲述方式。卡梅隆和Stability AI团队合作,重塑视觉媒体未来,令人期待。
【AI摘要:】
📽️ 卡梅隆加盟 Stability AI: 好莱坞传奇导演加入人工智能公司董事会,为公司带来重大胜利。
🤖 AI与CGI的结合: 卡梅隆认为生成式AI与CGI结合将推动故事讲述方式创新。
🌟 行业巨头的强强联合: Stability AI引入前Facebook总裁,增强公司行业影响力。
8、报道称Anthropic今年收有望突破10亿美元,年增长率高达1000%!
Anthropic是一家人工智能初创公司,预计今年收入将达到10亿美元,增长率高达1000%,显示出AI技术强劲需求。公司收入中60%到75%来自第三方API使用,市场高度依赖其技术。竞争对手OpenAI计划融资65亿美元,估值达1500亿,AI竞争激烈。AI技术正不断重塑各行业未来。
【AI摘要:】
🌟 Anthropic预计今年收入将突破10亿美元,年增长率高达1000%。
🤖 收入中60%到75%来自第三方API,市场对其技术高度依赖。
💰 OpenAI计划融资65亿美元,估值达1500亿,AI竞争愈发激烈。
9、HuggingFace推出HuggingChat原生macOS客户端
HuggingFace公司最新推出的HuggingChat原生macOS客户端为macOS用户带来了无缝且直观的高级AI对话体验,支持本地使用语言模型,并集成了Markdown、网页浏览、代码语法高亮等实用功能。用户可以通过简单的安装步骤快速启动应用,随时享受强大的AI聊天能力。
【AI摘要:】
🚀 HuggingChatOS客户端为macOS用户提供无缝且直观的高级AI对话体验。
💻 用户可以轻松安装HuggingChat,只需访问GitHub仓库的Releases部分,下载最新的HuggingChat-macOS.zip文件,解压缩后即可使用。
🔑 用户可以通过程序文件夹或使用快捷键⌘ + Shift + Return快速启动应用。
详情链接:https://github.com/huggingface/chat-macOS
10、警惕!黑客利用 ChatGPT 漏洞植入虚假记忆,窃取用户信息
最近,安全研究员约翰・瑞贝格发现了关于ChatGPT的漏洞,可能让黑客在用户的长期记忆中植入虚假信息和恶意指令。尽管OpenAI发布了部分修复措施,但用户仍需警惕不受信任内容可能带来的提示注入攻击。
【AI摘要:】
🛡️ ChatGPT漏洞可让黑客植入虚假信息至用户记忆中
💻 漏洞利用长期记忆功能永久窃取用户输入数据
🔍 用户需定期检查存储的记忆,防止虚假信息植入
详情链接:https://embracethered.com/blog/posts/2024/chatgpt-hacking-memories/
11、百度百舸4.0升级:秒级部署、95%训练效能、99.5%有效训练时长
百度百舸计算平台4.0升级,提升了多芯混合训练能力,有效训练时长超过99.5%,算力使用效率显著提升。升级后秒级部署,95%训练效能,99.5%有效训练时长,大幅提升部署效率,缩短业务上线周期。优化模型推理速度和成本,在长文本推理中效率提升超过一倍,满足市场需求。
【AI摘要:】
✨ 多芯混合训练能力提升,有效训练时长超过99.5%
⚙️ 秒级部署,95%训练效能,99.5%有效训练时长,提升部署效率
💡 优化模型推理速度和成本,长文本推理效率提升超过一倍
12、百度AI代码助手文心快码升级:推出企业级代码架构解释等功能
百度在2024年9月25日举行的百度云智大会上宣布了针对企业AI应用的重大升级,包括百舸AI异构计算平台4.0和千帆大模型平台3.0,以及对代码助手、智能客服和数字人等AI原生应用产品的全面更新。其中,文心快码是本次升级的亮点,专注于提升编码开发效率和质量,已服务超过1万家企业客户,帮助数百万中国开发者提升了编码效率,整体研发效率提高了20%。
【AI摘要:】
✨ 百度智能云宣布针对企业AI应用的重大升级,提高企业利用大模型的效率和经济性。
🚀 新升级的AI代码提效工具“文心快码”推出企业级代码架构解释和代码审查功能,提升编码开发效率和质量。
💡 文心快码推出企业级代码辅助能力,深度理解企业代码库,生成符合企业要求的代码。