国产六大推理模型正面硬刚OpenAI,谁更胜一筹?

声明:本文来自微信公众号“guangzi0088”(ID:TMTweb),作者:郝鑫,编辑:王潘,,授权Soraor转载发布。 “DeepSeek-R1如同当年苏联抢发的第一颗卫星,成为AI开启新时代的斯普特尼克时刻。” 2025年春节前,DeepSeek比除夕那天的烟花先一步在世界上空绽放。 离年

UniToken横空出世!多模态AI新标杆,单次编码实现图文理解+图像生成

声明:文来自微信公众号“量子位”,作者:UniToken团队,,授权Soraor转载发布。 首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局! 复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威

AI眼镜引爆消费热潮!上市公司抢滩布局,开启智能穿戴新纪元

近年来,人工智能(AI)技术的飞速发展正在不断改变着人们的生活方式。近期,AI眼镜作为新兴的消费电子产品,迅速从概念阶段走向市场,成为消费领域的新宠。这一趋势不仅吸引了广大消费者的目光,也促使众多上市公司纷纷布局AI眼镜产业链。 据了解,AI眼镜产业链主要包括上游零部件供应、中游整机设备制造以及下游

OpenAI重磅发布轻量版Deep Research,免费向所有用户开放!

Soraor(Soraor.com)4月25日 消息:今日,OpenAI 通过官方 X 平台发文称,由于很多用户喜欢使用 Deep Research 功能,所以将推出轻量版 Deep Research,且此版本面向所有用户开放。 “我们注意到很多用户都喜欢使用 Deep Research 功能,因此

LiveCC震撼发布:实时视频理解+语音解说,这个AI模型让视频"活"了!

LiveCC 是由新加坡国立大学和字节跳动 Show Lab开发的首个可实时视频评论(commentary)的大型视频大语言模型(Video LLM),聚焦于视频内容理解与生成自然、流畅的实时解说/弹幕评论。 能够处理动态的视频流输入,并通过实时语音转录增强模型对视频内容的理解能力。传统的视频处理模

OpenAI震撼发布GPT-Image-1图像生成API!4O最新功能详解+实战指南

OpenAI 发布最新的4o图像生成 API :gpt-image-1,该API支持基于文本提示生成、编辑和变体化图片。 gpt-image-1 是OpenAI目前最先进的模型,具有更强的理解能力、画面细节、现实世界知识以及更准确的文本渲染能力,推荐优先使用。 gpt-image-1 的主要亮点包括

微软重磅发布GPT-image-1模型,开发者API全面开放!

4月24日凌晨,OpenAI正式推出了其全新图像生成模型GPT-image-1,并通过API向全球开发者开放使用。这一模型的发布标志着图像生成技术的又一次飞跃,为开发者带来了更多可能性。 GPT-image-1与OpenAI此前的ChatGPT版本有很大不同,它不仅能够生成高质量的图像,还支持多种高

OpenAI震撼发布GPT-image-1!吉卜力风格AI绘画迎来史诗级进化

声明:本文来自于微信公众号AIGC开放社区,授权Soraor转载发布。 今天凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。 GPT-image-1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压