算子简报

2025-03-24 · 算子简报

1

阿里通义实验室推出LHM技术,实现快速3D人体重建

阿里通义实验室的LHM技术在3D人体重建领域取得了重要突破。

该技术能够从单个图像快速生成动画化的3D人体模型,且无需复杂的后期处理。

LHM技术展现出优越的泛化能力,适应不同场景和光照条件,推动了该领域的应用前景。

2

腾讯发布混元 - T1 正式版,推理能力显著提升

腾讯最近正式推出了混元 - T1,这款新模型在推理能力上有了显著提升。

混元 - T1通过大规模后训练,解决了长文本推理中的上下文丢失问题。

该模型在计算资源消耗上进行了优化,特别是在深度思考和复杂问题解决方面表现优异。

3

vivo成立机器人LAB,进军家庭机器人领域

vivo 最近成立了专注于家庭机器人研发的实验室,标志着其在机器人领域的探索。

公司高层表示,vivo 在人形机器人领域具备独特的技术优势,尤其是在智能算法和混合现实技术方面。

未来,vivo 计划利用这些技术解决行业中的技术难点,并在医疗和养老等领域应用机器人。

4

王兴透露美团已开发内部大模型LongCat,投资数十亿元GPU资源

美团在2024年全年实现了3376亿元人民币的营收,增长22%。

CEO王兴在业绩发布会上阐述了美团在人工智能领域的战略,包括对AI基础设施的投资和大模型Longcat的研发。

美团计划将AI技术广泛应用于员工工作流程和产品升级,提升运营效率。

5

苹果重组AI高管团队,Siri升级推迟至2026年

苹果公司近期对其高管团队进行了重大调整,旨在提升人工智能战略的执行力。

由于研发进展滞后,原定于今年推出的Siri升级计划被推迟至2026年。

这一变化反映出苹果在面对竞争压力时的紧迫感。

6

谷歌推出Gemini实时AI视频功能,手机摄像头实时解读画面内容

谷歌最近推出了Gemini Live的新功能,使其能够通过手机摄像头实时回答用户的问题。

这一创新是在近一年的研发后首次面世,用户在小米手机上已经体验到了这一功能。

此次更新进一步巩固谷歌在智能助手市场的领先地位。

7

新一代AI图像生成模型Reve Image震撼登场,引领创作新潮流

Reve Image是一款全新的AI图像生成模型,专注于提升美学表现和提示遵循能力。

该模型展现出强烈的设计感,生成的作品简洁大气,具有海报风格的视觉冲击力。

用户反馈其生成能力已足以媲美市场领先技术,且平台设计友好,操作流畅。

8

全球首个体重管理AI大模型“减单”在合肥发布

在合肥发布的全球首个体重管理AI大模型“减单”,旨在帮助超重和肥胖患者有效管理体重。

该模型结合多种数据,能够智能分析饮食情况,提供健康管理建议。

预计未来三年将覆盖超过1亿名慢性病患者,助力健康管理。

9

开源实时识别模型RF-DETR:实时识别画面中的物体,开源可商用

RF-DETR是由Roboflow团队开发的一款开源实时目标检测模型,旨在解决YOLO系列模型在速度和精度上的不足。

它在COCO数据集上实现了超过60%的平均精度,并且在GPU上具备极低的延迟。

该模型适用于自动驾驶、工业质检等需要快速反应的场景。

10

Cloudflare推出“AI迷宫”,引导恶意爬虫走入虚假数据陷阱

Cloudflare 最新推出的 “AI Labyrinth” 工具旨在通过引导恶意网络爬虫进入虚假页面,打击未经授权的数据抓取行为。

这一创新措施不仅可以拖延和迷惑爬虫,还能帮助网站管理员识别新的爬虫模式。

网站管理员可在 Cloudflare 仪表板上启用此功能,未来还将扩展为更复杂的链接网络。

11

AbletonMCP:调用Ableton的MCP服务,让Claude能够创作音乐

AbletonMCP 是一款创新工具,通过模型上下文协议将音乐制作软件 Ableton Live 与 Claude AI 连接。

该系统由 Ableton 远程脚本和 MCP 服务器组成,用户可以通过 Claude 与 Ableton 进行互动。

此工具提供了一种全新的音乐创作体验,支持多种音轨和剪辑操作。