算子简报

2025-04-16 · 算子简报

1

字节跳动整合AI研发团队,AI Lab并入Seed

字节跳动正在进行AI研发团队的整合,将独立的字节AI Lab并入Seed团队。

这一举措体现了字节在AI领域战略布局的调整,旨在进一步提升其研发能力。

自2016年成立以来,AI Lab为公司的产品创新提供了强有力的支持。

2

ChatGPT推出图像库功能,提升用户体验

OpenAI推出了ChatGPT的图像库功能,允许用户集中管理所有通过GPT生成的图片。

该功能提升了用户的创作体验,支持编辑和分享,适用于免费、Plus及Pro用户。

用户可以轻松存储和编辑生成的图片,简化了操作流程。

3

Veo2登陆Google AI Studio,生成超逼真视频

Google DeepMind的Veo2视频生成模型正式推出,标志着AI视频生成技术的重大突破。

Veo2支持从文本或图像生成高达720p分辨率的视频,具备卓越的视觉真实感。

其独特的电影语言理解能力使得用户能够生成专业级视频,广泛应用于内容创作、营销、教育等领域。

4

蚂蚁百宝箱推出“MCP专区”,上线30余款服务

蚂蚁集团的智能体平台“百宝箱”推出了“MCP专区”,支持多种MCP服务的部署和调用。

该专区旨在提升智能体与外部工具的配置效率,开发者可快速构建连接MCP服务的智能体。

首期上线的“支付MCP Server”解决了智能体间的支付问题,降低了开发门槛。

5

3D视觉大模型SpatialLM开源,推动技术发展

SpatialLM是杭州群核科技开源的一款3D视觉大语言模型,具备强大的空间理解能力。

该模型通过普通视频生成物理正确的3D场景,显著降低了数据采集门槛。

其开源举措为具身智能开发提供了基础框架,推动了3D视觉技术的普及与创新。

详情链接
6

国家超算平台发布新一代多模态大模型

国家超算互联网平台推出的“超长文本多模态大模型”标志着人工智能技术的又一次重要进步。

该模型由上海稀宇科技有限公司研发,提升了自然语言处理和计算机视觉的能力。

新模型为企业智能化转型提供了强有力的支持,助力行业发展。

7

阿里云AIStack大模型一体机首次亮相

阿里云推出了全新的AIStack大模型一体机,标志着其在企业级AI解决方案领域的重要进展。

该一体机集成了软硬件,旨在为政务、能源、医疗等行业提供高性价比的智能服务。

AIStack已在多个领域应用,显著提升工作效率。

8

Grok-3重大更新,Grok Studio上线

Grok Studio的推出标志着Grok-3向综合生产力平台的转型,提供多种功能满足开发者需求。

该平台的实时预览和Google Drive集成提升了用户体验,适合远程协作和快速原型开发。

Grok Studio面向所有用户开放,提供免费和付费版本,满足不同用户的需求。

详情链接
9

Ghiblio.art实现吉卜力风格转换,成为社交新宠

Ghiblio.art 是一个在线 AI 工具,可以将用户上传的照片转换为吉卜力风格的艺术作品。

用户能够快速生成高质量的插画,适用于人像、宠物和风景等多种场景。

尽管平台提供免费试用,部分功能需要付费解锁,且存在关于版权和隐私的讨论。

详情链接
10

OpenAI计划推出社交媒体功能,整合ChatGPT

OpenAI正在开发一项新的社交媒体功能,可能会与其流行的ChatGPT工具整合。

该功能的核心在于图像生成,用户能够创建并分享AI生成的图像。

这一举措被视为对现有社交媒体巨头的挑战,同时也引发了关于用户隐私和内容审核的关注。

11

Anthropic即将推出语音AI助手Claude

Anthropic即将推出其新的语音AI助手Claude,预计将在本月内正式发布。

该助手将允许用户通过语音与Claude进行互动,提升人机交流的自然性与便捷性。

Anthropic计划推出三种英语语音模式,以提供多样化和个性化的交流体验。

12

Gamma发布全新升级的2.0平台,内容创作全面进化

Gamma 2.0平台的推出标志着AI内容创作工具的一次重大升级。

新平台以其现代化的用户界面和三大核心功能的深度优化,提升了用户的内容生成体验。

支持文档、演示文稿与网页创作等功能,使得创作过程更加高效便捷。

13

Hugging Face收购Pollen Robotics,进军机器人领域

Hugging Face最近收购了法国人形机器人初创公司Pollen Robotics,标志着其在机器人领域的战略布局。

这一收购将推动开源机器人生态的发展,特别是其核心产品Reachy2。

Reachy2是一款具有7自由度机械臂的人形机器人,适合教育和研究。