欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、快手推出“可灵AI”独立APP 加码移动端AI创作布局

快手最近推出了“可灵AI”独立APP,致力于在移动端扩展AI创作领域。该APP基于快手自研的可灵大模型和可图大模型,提供视频、图片生成与编辑能力。尽管功能上不及网页版,但已吸引360万用户,创作超过3700万个视频和一亿张图片。与抖音的“即梦AI”APP形成竞争。

image

【AI摘要:】

🚀 快手推出“可灵AI”独立APP,扩展移动端AI创作布局。

💡 “可灵AI”APP基于自研大模型,提供视频、图片生成与编辑能力。

💪 已吸引360万用户,创作超过3700万视频和一亿张图片。与抖音的“即梦AI”形成竞争。

2、智谱AI开源最新版视频模型CogVideoX v1.5

智谱技术团队发布了最新的视频生成模型CogVideoX v1.5,并将其开源。这一版本在视频生成能力方面有重大提升,支持5/10秒视频、768P分辨率和16帧生成能力。新清影平台上线,结合CogSound音效模型,提供超高清4K视频生成。数据处理与算法创新确保视频质量和连贯性。

image

【AI摘要:】

🚀 CogVideoX v1.5开源,支持5/10秒视频、768P分辨率和16帧生成能力。

🎬 新清影平台上线,结合CogSound音效模型,提供超高清4K视频生成。

🔬 数据处理与算法创新,确保生成视频的质量和连贯性。

详情链接:https://github.com/thudm/cogvideo

3、报道称百度将发布一款内置 AI 助手的智能眼镜,基于文心模型

百度计划推出一款内置小度 AI 助手的智能眼镜,将在2024年度百度世界大会上展示。这款眼镜具有创新功能,提供全新智能体验。

【AI摘要:】

🌟 眼镜将配备摄像头,支持照片和视频拍摄功能。

📷 眼镜支持基于 Ernie 模型的语音交互,提升用户体验。

🗣️ 百度智能眼镜将提供更个性化、符合中国用户需求的解决方案。

4、氪金玩家狂喜!Krea AI上线Lora训练功能

Krea AI推出了Lora训练功能,为用户提供个性化角色、风格、产品等训练服务。用户上传多张图片即可开始训练,界面简洁易用。训练参数设置简单,训练效果良好,对小白用户友好。会员价格为每月10美元,支持商用。

【AI摘要:】

🔥 Krea AI推出Lora训练功能,让用户定制个性化角色、风格、产品等训练服务。

💡 界面简洁,上传图片后即可设置基础参数,训练过程简单易上手。

💰 会员价格每月10美元,可生成720张FLux图像,36000张实时图像,支持商用。

详情链接:https://www.krea.ai/train

5、可灵推自定义模型功能 克服AI视频生成角色一致性难题

可灵最新推出的自定义模型功能为AI视频生成领域带来重要突破,解决了角色一致性的技术难题。该功能让创作者上传多个视频片段进行训练,支持使用可灵自身生成的AI视频,提供更大灵活性。训练后系统能生成保持角色一致性的视频内容,展示出色彩斑斓的创作可能。

image

【AI摘要:】

🔑 创作者可上传多个视频片段进行模型训练,支持使用可灵自身生成的AI视频,提供更大灵活性。

🚀 训练完成后系统能生成保持角色一致性的视频内容,展示360度旋转展示和复杂场景的稳定外观特征。

💡 KLING1.5版本支持1080p高清视频输出,提供多种格式选择,满足不同平台的内容需求。动作笔刷工具提升视频创作精确度和灵活性。

6、小巧强大!口袋级视觉AI模型moondream2,手机就能运行

Moondream推出的moondream2是一款性能出色的紧凑型视觉语言模型,仅有16亿参数,可在智能手机等小型设备上运行。该模型具备强大的文本和图像处理能力,在各项基准测试中表现优异。Moondream团队持续更新模型性能,成功筹集450万美元资金,CEO具有丰富经验。

image

【AI摘要:】

🌟 Moondream推出moondream2,仅有1.6亿参数,可在智能手机等小型设备上运行。

💰 Moondream成功筹集450万美元资金,CEO曾在亚马逊工作,团队持续更新提升模型性能。

📈 moondream2具备强大的文本和图像处理能力,能回答问题、进行OCR、物体计数和分类,基准测试表现出色。

详情链接:https://huggingface.co/vikhyatk/moondream2

7、小米官宣大模型小爱升级:多端设备支持“音乐问答”功能

小米官方宣布大模型小爱音乐能力升级,新增了「音乐问答」功能,用户可在多端设备上体验。这一功能基于人工智能能力提升,帮助用户查询歌曲信息和解答专业音乐知识。小爱同学在今年7月经历了重大版本更新,全面提升了自然问答和智能助手功能,提升用户体验。

image

【AI摘要:】

🎵 小米小爱同学新增「音乐问答」功能,支持歌曲信息查询及专业音乐知识解答。

📱 功能适用于多端设备,用户需将小爱同学升级至最新版本。

🚗 小爱同学在过去的更新中,全面提升了自然问答及智能助手的多项功能,提升用户体验。

8、Mistral AI推出多语言内容审核API,挑战OpenAI

Mistral AI推出了一款全新的内容审核API,旨在与行业领军者竞争,解决AI安全与内容过滤问题。该API基于Ministral8B模型,能检测多种有害内容,支持多语言,并已在Le Chat平台上投入使用。Mistral与多家企业合作,展现其成熟技术和欧洲视角。

image

【AI摘要:】

🌍 多语言支持:API覆盖11种语言,检测色情内容、仇恨言论等有害内容。

🔗 与企业合作:在Le Chat平台应用,与微软Azure、Qualcomm等建立合作关系。

🔒 技术优势:以对话背景为基础,提升对潜在有害内容的检测能力。

详情链接:https://docs.mistral.ai/capabilities/guardrailing/

9、AI “电子舌”来了!可品尝食物味道,轻松检测食品新鲜度

科学家们成功研发出一种名为“电子舌”的新型设备,利用人工智能技术,能准确区分不同咖啡混合物,检测食品和饮料新鲜度,为食品检测和品质控制提供新解决方案。电子舌模仿人类味觉技术,提高准确性和工作效率,可加速口味研发和确保产品品质。具备监测食品新鲜度功能,保护消费者健康,商家质量把控。未来应用前景广阔,可拓展至医药和环境监测等多个领域。

image

【AI摘要:】

🌟 电子舌利用人工智能技术,准确区分不同咖啡混合物。

🍽️ 检测食品和饮料新鲜度,防止变质。

🔬 未来电子舌有望应用于医药和环境监测等多个领域。

详情链接:https://www.nature.com/articles/s41586-024-08003-w

10、谷歌黑科技ReCapture:可一键生成“多机位”视频大片

ReCapture技术是谷歌研究院推出的一项创新技术,通过重新生成带有自定义摄像机轨迹的视频,让用户可以从全新视角体验原始视频内容。这项技术背后的原理并不复杂,通过多视角扩散模型和遮罩视频微调技术,实现粗略视频到清晰、连贯、动感视频的转变。谷歌的研究人员表示,ReCapture不需要大量训练数据,适用于各种视频和视角转换,让普通用户也能轻松制作专业级“多机位”视频。

image

【AI摘要:】

🔍 ReCapture技术让用户重新体验视频,生成带有自定义摄像机轨迹的新版本。

🛠️ 利用多视角扩散模型和遮罩视频微调技术,实现粗略视频到清晰、连贯、动感视频的转变。

🎥 ReCapture不需要大量训练数据,适用于各种视频和视角转换,让普通用户也能制作专业级“多机位”视频。

详情链接:https://generative-video-camera-controls.github.io/

11、OpenAI在版权诉讼中胜诉,AI数据抓取合法化成趋势?

近日,纽约南区法院驳回了Raw Story Media,Inc.和AlterNet Media,Inc.对OpenAI提起的版权侵犯诉讼,认为该案缺乏立案资格。这一裁决标志着在AI与版权之间的法律争议中,OpenAI赢得了一场重要的胜利,也为未来类似案件的处理提供了参考。法院裁定驳回诉讼,强调生成型AI的内容综合性使得逐字复制的可能性较小,为未来AI与版权纠纷的处理提供了法律参考和启示。

【AI摘要:】

📜 原告未能证明因OpenAI的行为造成实际损害,法院裁定驳回诉讼。

🔍 法官强调生成型AI的内容综合性使得逐字复制的可能性较小。

⚖️ 该判决为未来AI与版权纠纷的处理提供了法律参考和启示。

12、微软Outlook推出基于AI个性化动态主题,根据天气和位置动态更新

微软最新推出的Co pilot 主题功能为Outlook带来了个性化的视觉体验,让用户能够定制独特的外观。AI驱动的主题功能不仅美观亲切,还能根据天气、地点等因素动态更新,提升用户体验。用户可以享受到更愉悦和个性化的电子邮件管理体验。

image

【AI摘要:】

🌈 Co pilot 主题功能需要Co pilot Pro或企业许可证支持

🌦️ 用户可以根据天气和地点定制主题,实现动态更新

🎨 提供多种非AI主题选项,包括绿色、红色和紫色,适用于各个版本的Outlook