欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:soraor.com
1、挑战谷歌!OpenAI推搜索引擎SearchGPT初期仅邀请1万人测试
OpenAI推出SearchGPT,一个由人工智能驱动的搜索引擎,与传统搜索引擎不同,它整理和总结搜索结果。目前处于原型阶段,由GPT-4支持,向1万测试用户开放。OpenAI与第三方合作构建搜索结果,计划将搜索功能集成到ChatGPT中。
【AI摘要:】
🔍 SearchGPT是由人工智能驱动的搜索引擎,整理和总结搜索结果。
🚀 目前处于原型阶段,由GPT-4支持,向1万测试用户开放。
💡 OpenAI计划将搜索功能直接集成到ChatGPT中,与Google竞争,注重内容使用合作与信息归属清晰性。
详情链接:https://chatgpt.com/search
2、智谱AI推出AI生成视频产品清影
智谱AI推出了名为清影(Ying)的AI大模型,能够将任意文字生成视频,用户只需输入一段文字和选择风格即可生成高精度视频。清影已上线清言App,支持文本生成视频和图片生成视频,同时推出“照片动起来”小程序。CEO张鹏提到清影底座的视频生成模型CogVideoX融合了文本、时间和空间三个维度,提升了推理速度。用户可以通过智谱清言PC/APP体验清影,将灵感转化为艺术视频创作。
【AI摘要:】
🎥 清影是智谱AI推出的AI大模型,能够生成高精度视频,支持文本生成视频和图片生成视频。
💡 清影基于新型DiT模型架构,融合文本和视频内容,提升了指令遵从能力和内容连贯性。
🚀 CogVideoX是清影底座的视频生成模型,融合了文本、时间和空间三个维度,提升了推理速度,未来将推出更高分辨率、更长时长的生成视频功能。
详情链接:soraor.com
3、字节跳动发布豆包·图生图模型 豆包大模型日均tokens使用量超5000亿
火山引擎在成都举办了2024AI 创新巡展,宣布豆包大模型日均tokens使用量超过5000亿,客户日均使用量增长22倍。张鑫副总裁表示火山引擎正向智能化、行业化和区域化方向发展,助力企业实现业务创新。发布豆包大模型的最新能力包括视觉图像、语音合成、声音复刻等升级。
【AI摘要:】
🚀 豆包大模型日均tokens使用量超5000亿,客户日均使用量增长22倍。
🔍 豆包·图生图模型和豆包·文生图模型在保留原图特征和提升画面质感方面表现突出。
🔊 豆包·语音合成模型和豆包·声音复刻模型在表达情绪和还原说话人声音特征方面有所提升。
4、AI视频生成器Runway被曝使用盗版YouTube内容进行训练
这篇文章揭露了Runway公司开发的Gen-3Alpha视频生成器使用盗版内容的丑闻,引发了版权争议。AI公司频频触犯版权法,立法者也在重新审视版权法规以适应新的技术挑战。
【AI摘要:】
📊 Runway视频生成器被曝使用盗版内容—引发版权争议
🛡️ AI公司频频触犯版权法—版权纠纷成为AI发展的瓶颈
📜 立法者重新审视版权法规—法律和版权使用政策不断更新
5、告别标题难民!B站上线AIGC推荐广告标题功能
在这个创意为王的时代,B站推出的AIGC推荐广告标题功能为广告创作注入了新的活力。通过AI生成的10个爆款标题,让创作过程更简单高效,为广告效果提升增添了可能。
【AI摘要:】
🔑 创意为王,标题是关键。AIGC推荐广告标题功能让创作更简单高效。
🤖 AI大师背后,基于海量数据训练。生成风格各异、抓人眼球的标题。
🚀 持续优化AI大师,让标题更精准、更有针对性。广告创作自由度得到大胆拓展。
6、即刻AI搜索神器问问小宇宙来了
即刻App推出了基于小宇宙的AI搜索功能——问问小宇宙,专注于声音内容的深度挖掘,提供深度讨论和独到见解。界面复古的配色和个性化推荐功能是其特色,让搜索结果更加丰富、多元,贴近用户需求。
【AI摘要:】
🔍 问问小宇宙是基于小宇宙的AI搜索功能,专注声音内容挖掘。
🎧 提供深度讨论和独到见解,推荐相关音频内容。
🎨 界面复古配色,个性化推荐功能,丰富、多元的搜索结果,贴近用户需求。
详情链接:soraor.com
7、翻译界的“AI特工”!字节跳动推端到端语音同步翻译系统CLASI
CLASI是字节跳动推出的端到端语音同步翻译系统,为全球交流带来革新。它结合语言模型和信息检索系统,实现准确快速的翻译,具备上下文记忆功能,超越人类译员。虽然不完美,但通过机智的应对能力,提供高效的翻译服务。CLASI的出现开辟了跨语言交流新天地,为人类沟通方式带来温和革新。
【AI摘要:】
🌐 CLASI是端到端语音同步翻译系统,结合语言模型和信息检索系统,实现准确快速翻译。
🧠 CLASI具备上下文记忆功能,能联系之前内容确保翻译连贯性,超越人类译员。
🔍 CLASI通过机智的应对能力,猜测意思并提供合理翻译,在传达有效信息能力上胜过商业和开源系统。
详情链接:soraor.com
8、武汉大学联合中国移动九天人工智能团队开源音视频说话人识别数据集 VoxBlink2
武汉大学联合中国移动九天人工智能团队和昆山杜克大学基于YouTube数据开源了超过11万小时的音视频说话人识别数据集VoxBlink2,是目前最大的公开可用的音视频说话人识别数据集。该数据集丰富了开源语音语料库,支持训练声纹大模型。
【AI摘要:】
🔍 数据集规模超过11万小时,包含9904382个高质量音频片段及视频片段,来自YouTube上的111284名用户。
🔬 数据集经过多步骤的数据挖掘,包括候选人准备、人脸提取&检测、人脸识别、活动说话人检测等,准确率提升至92%。
🛠 VoxBlink2开源了不同大小的声纹模型,包括基于ResNet的2D卷积模型和基于ECAPA-TDNN的时序模型,以及超大模型ResNet293,在Vox1-O数据集上表现出色。
详情链接:https://VoxBlink2.github.io
9、谷歌Gemini重大更新:多语言支持、性能提升、面向青少年开放
谷歌宣布对其AI聊天机器人Gemini进行全面升级,包括多语言支持、性能提升和面向青少年开放。这次更新将提升用户体验,降低运营成本,增加透明度,拓展应用场景,展现谷歌在AI领域的雄心和决心。
【AI摘要:】
🌐 多语言支持: Gemini1.5Flash支持40种语言,覆盖230个国家和地区,提升质量和响应速度。
🔍 上下文窗口扩展: Gemini上下文窗口扩展到32,000个标记,支持更长文本处理和文件上传功能。
🚀 更广泛的应用场景: Gemini功能将扩展到Messages应用集成、手机应用推广和面向青少年开放。
10、轻松调优!微软针对Phi-3小型语言模型推出无服务器微调功能
微软推出针对Phi-3小型语言模型的无服务器微调功能,为开发者提供了轻松调整和优化模型性能的便利。这一举措将进一步推动AI应用的发展和普及。
【AI摘要:】
📈 无服务器微调功能:开发者可以在无需管理服务器的情况下,轻松调整Phi-3模型,提高性能表现。
💰 高性价比的Phi-3模型:以低成本提供高效性能,适用于各种企业应用场景。
🤖 市场竞争激烈:微软与OpenAI等AI提供商之间的竞争加剧,推动了AI行业的发展。
详情链接:https://azure.microsoft.com/en-us/blog/announcing-phi-3-fine-tuning-new-generative-ai-models-and-other-azure-ai-updates-to-empower-organizations-to-customize-and-scale-ai-applications/
11、马斯克寻求特斯拉董事会批准向 xAI 注资50亿美元
马斯克计划向人工智能初创公司 xAI 投资50亿美元,可能引发科技公司网络利益冲突。特斯拉转型为机器人和人工智能公司,马斯克承诺建立自主机器人出租车和人形机器人车队。 xAI 成立于去年7月,估值180亿美元,马斯克追赶竞争对手OpenAI和Anthropic。
【AI摘要:】
🚀 马斯克计划向 xAI 投资50亿美元,可能引发科技公司网络利益冲突。
🤖 特斯拉转型为机器人和人工智能公司,马斯克承诺建立自主机器人出租车和人形机器人车队。
💰 xAI 成立于去年7月,估值180亿美元,马斯克追赶竞争对手OpenAI和Anthropic。
12、谷歌AI几何超进化:IMO金牌之争,19秒解题速度碾压人类选手
本文介绍了谷歌DeepMind的AI系统在国际数学奥林匹克竞赛(IMO)上的惊人表现,以一分之差惜败夺得银牌。AI展现出超凡的解题能力和速度,碾压人类选手,引发人们对AI在数学领域的无限可能性的思考。
【AI摘要:】
🏅 AI系统在IMO竞赛中以惊人表现夺得银牌,展现出超凡的解题能力和速度。
🧠 AlphaProof和AlphaGeometry2两款AI系统擅长数学推理和几何解题,在未来发展中具有巨大潜力。
🌐 谷歌AI在数学领域的超进化挑战人类智能,为人工通用智能(AGI)的发展提供新方向。
详情点此查看:https://www.chinaz.com/ainews/10608.shtml
13、Anthropic的爬虫机器人无视网站反AI抓取政策遭吐槽
Anthropic公司的爬虫机器人ClaudeBot在24小时内频繁访问多个网站,引发了网站所有者和创始人的不满。这种行为不仅违反了使用条款,还占用了网站的开发资源,导致多个网站遭受爬虫侵扰。
【AI摘要:】
🤖 爬虫频繁访问iFixit、Read the Docs等网站,违反使用条款和占用开发资源。
🔒 iFixit已添加crawl-delay扩展限制爬虫访问,其他网站也遭到侵扰。
🚫 许多AI公司通过robots.txt拒绝爬虫访问,但存在忽略规则和保护数据的争议。