信息差

AI界日报：AutoGLM升级版问世；Kimi启动AI视频生成功能灰测；SD3.5L扩展三项ControlNet功能；纪念ChatGPT问世两周年

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、震撼来袭!StabilityAI的SD3.5L新增三大ControlNet功能生图能力再升级

Stability AI 发布了新版StableDiffusion3.5Large，新增三种 ControlNet 功能，分别是Blur、Canny和Depth，显著提升了图像生成能力。用户可在不商业化的前提下免费使用该模型，尤其是年收入低于100万美元的小型企业和创作者也可享受商业用途的免费使用权。

【AI摘要:】

🌟 新增三种 ControlNet 功能:Blur、Canny和Depth，提升图像生成能力。

💼 免费使用协议:个人和年收入低于100万美元的企业可免费使用模型。

🔒 强调安全性:Stability AI 采取措施，防止模型被滥用。

详情链接:https://stability.ai/news/sd3-5-large-controlnets

2、Kimi内测AI视频生成功能:每天免费100秒创作空间

人工智能聊天工具Kimi正在内测其创新的AI视频生成服务——Kimi创作空间，目前处于灰度测试阶段，旨在为用户提供全新的创意表达方式。用户可以利用12种预设风格模板和自定义创作功能，制作个性化的音乐视频，每天还可免费生成100秒的视频。

【AI摘要:】

🎨 Kimi创作空间提供12种预设风格和自定义功能，让用户自由创作个性化视频。

🎶 用户每天可免费生成100秒的视频，极大地提升了创作的灵活性。

💡 该功能支持详细描述视频场景，为创意表达提供更多可能性，推动AI视频生成技术的发展。

3、跨界无限!智谱AI发布AutoGLM升级版，一句话操控全网APP

智谱AI近期发布了AutoGLM的多个升级版本，包括浏览器版和电脑版，展现出强大的跨APP操作能力。用户只需一句话即可在多个应用间自由切换和操作，极大提升了效率。

【AI摘要:】

⚡ 跨APP操作能力:用户只需一句话即可在多个应用间进行操作，极大提升了使用效率。

🖥️ GLM-PC语音操控:通过语音指令直接操控电脑，简化工作流程，成为打工人的救星。

🌟 AutoGLM全能助手:支持主流APP，用户可以轻松完成点餐、搜索等任务，展现出AI的智能化和灵活性。

4、特斯拉 “Optimus ” 机器人升级:手部设计更灵巧、更敏感!

特斯拉公司对其人形机器人“Optimus”进行了重大的手部设计升级，新增22个自由度和柔软的保护层，提升了机器人的灵活性和触觉感应能力。这一创新将为机器人在家庭、医疗和工业等领域的应用提供更多可能性，展示了特斯拉在机器人技术领域的持续探索。

【AI摘要:】

🤖 新手部设计具备22个自由度，提升操作灵活性和精准度。

🛡️ 新增的保护层增强触觉感应能力，安全处理精细物品。

⚙️ 所有驱动器集成于前臂，计划年底前完成传感器整合并减轻重量。

5、亚马逊开发新型多模态语言模型 “Olympus” 或将亮相 AWS 大会

亚马逊正在开发一种名为“Olympus”的多模态大型语言模型，预计将在下周的AWS re:Invent大会上发布。该模型不仅能处理文本，还能处理图像和视频，具有广泛的应用潜力。

【AI摘要:】

💡 新模型“Olympus”将处理文本、图像和视频，支持自然语言搜索特定视频片段。

🚀 该模型预计将在下周的AWS re:Invent大会上正式发布，可能作为AWS Bedrock的一部分。

🔧 亚马逊的AI战略不仅包括软件，还涉及硬件开发，推出了针对训练和推理的专用芯片系列。

6、Rhymes AI推出革命性文本图像视频生成模型Allegro-TI2V

Rhymes AI最近推出的Allegro-TI2V模型，标志着文本到视频生成技术的重大进步。该模型不仅支持高达79.2K的上下文长度和720×1280的输出分辨率，还具备高效的视频生成能力，能够满足创作者在电影、游戏和数字艺术等领域的需求。

【AI摘要:】

🚀 Allegro-TI2V支持高达79.2K的上下文长度和720×1280的分辨率，视频生成速度可达每秒15帧。

🎨 该模型引入了后续视频生成和中间视频生成两种新模式，极大提升了视频创作的灵活性与效率。

💻 Rhymes AI在Apache2.0许可下发布Allegro-TI2V，用户可通过简单安装快速上手，应用前景广泛。

详情链接:https://huggingface.co/rhymes-ai/Allegro-TI2V

7、恐怖如斯!AI只需两小时访谈，完美复刻一个人个性、85%准确率!

近期，研究团队与谷歌DeepMind合作，开发出一种新型AI应用，能够在仅两小时的访谈后生成个性模拟，准确率高达85%。这一技术基于ChatGPT大语言模型，通过提问和记录参与者的回答，深入了解个性特征。

【AI摘要:】

🔍 AI模型在两小时访谈后生成个性模拟，准确率达到85%。

💡 该技术旨在降低社会学研究的成本与时间，提高调查的有效性和广泛性。

🤖 模拟的个性被称为“代理人”，未来可能改善工作助手及个人机器人的人机互动体验。

详情链接:https://techxplore.com/journals/arxiv/

8、谷东科技发布双目全彩AI+AR眼镜:无感佩戴+高清镜头

谷东科技推出的Star1和Star1S眼镜代表了AI与AR技术的完美结合，提供了全彩显示和强大的AI功能。这些眼镜不仅在设计上考虑了佩戴舒适度，还在技术上实现了高清画质和多模态AI系统的应用。Star1S作为业内首款全彩双目阵列光波导AR眼镜，预计将于12月上市。

【AI摘要:】

🖼️ Star1S是首款全彩双目阵列光波导AR眼镜，提供更高的佩戴舒适度和画面清晰度。

🤖 搭载多模态AI系统，Star1S在多种环境下实现全天候长续航，满足不同场景需求。

📱 支持与主流应用兼容，用户可通过眼镜直接接打电话、观看视频，功能接近智能手机。

9.ChatGPT 诞生两周年，用户数突破2亿

ChatGPT 自2022年推出以来，经历了快速发展，成为日常生活中不可或缺的数字工具。用户在短时间内激增，现已超过2亿，每月访问量达到31亿。新版本 GPT-4o 和搜索功能的推出，提升了用户体验，但仍存在信息准确性和伦理问题。OpenAI 正在努力解决这些挑战，以进一步优化其服务和用户信任。

【Soraor 提要:】

🌐 ChatGPT 用户数在两年内激增，成为家庭中重要的数字助手。

🔍 新推出的搜索功能改善了信息获取方式，挑战传统搜索引擎。

⚖️ ChatGPT 仍面临信息准确性和伦理问题，需进一步提升解决方案。

10、超速崛起!xAI仅用1年多就达到了500亿美元的估值

埃隆·马斯克的人工智能公司xAI在短短16个月内达到了500亿美元的估值，超越了许多竞争对手。与OpenAI相比，xAI的迅速崛起展示了其在AI领域的强大潜力和市场吸引力。公司通过融资和技术创新，尤其是超级计算机的建设，进一步巩固了其在行业中的地位。

【AI摘要:】

🚀 xAI在成立16个月内达到了500亿美元的估值，超越了多家竞争对手。

💰 近期完成了50亿美元的融资，用于购买NVIDIA芯片，支持超级计算机建设。

🤖 聊天机器人Grok成为市场强劲竞争者，通过社交媒体训练提升其响应能力。

如果觉得文章对你有用，请随意赞赏

快讯

AI界日报：AutoGLM升级版问世；Kimi启动AI视频生成功能灰测；SD3.5L扩展三项ControlNet功能；纪念ChatGPT问世两周年

https://soraor.com/archives/ai-today_20241129153438

作者

破晓

发布于

2024-11-29

更新于

2024-11-29

许可协议

CC BY 4.0