算子简报
2025-03-24 · 算子简报
阿里通义实验室推出LHM技术,实现快速3D人体重建
•阿里通义实验室的LHM技术在3D人体重建领域取得了重要突破。
•该技术能够从单个图像快速生成动画化的3D人体模型,且无需复杂的后期处理。
•LHM技术展现出优越的泛化能力,适应不同场景和光照条件,推动了该领域的应用前景。
腾讯发布混元 - T1 正式版,推理能力显著提升
•腾讯最近正式推出了混元 - T1,这款新模型在推理能力上有了显著提升。
•混元 - T1通过大规模后训练,解决了长文本推理中的上下文丢失问题。
•该模型在计算资源消耗上进行了优化,特别是在深度思考和复杂问题解决方面表现优异。
vivo成立机器人LAB,进军家庭机器人领域
•vivo 最近成立了专注于家庭机器人研发的实验室,标志着其在机器人领域的探索。
•公司高层表示,vivo 在人形机器人领域具备独特的技术优势,尤其是在智能算法和混合现实技术方面。
•未来,vivo 计划利用这些技术解决行业中的技术难点,并在医疗和养老等领域应用机器人。
王兴透露美团已开发内部大模型LongCat,投资数十亿元GPU资源
•美团在2024年全年实现了3376亿元人民币的营收,增长22%。
•CEO王兴在业绩发布会上阐述了美团在人工智能领域的战略,包括对AI基础设施的投资和大模型Longcat的研发。
•美团计划将AI技术广泛应用于员工工作流程和产品升级,提升运营效率。
苹果重组AI高管团队,Siri升级推迟至2026年
•苹果公司近期对其高管团队进行了重大调整,旨在提升人工智能战略的执行力。
•由于研发进展滞后,原定于今年推出的Siri升级计划被推迟至2026年。
•这一变化反映出苹果在面对竞争压力时的紧迫感。
谷歌推出Gemini实时AI视频功能,手机摄像头实时解读画面内容
•谷歌最近推出了Gemini Live的新功能,使其能够通过手机摄像头实时回答用户的问题。
•这一创新是在近一年的研发后首次面世,用户在小米手机上已经体验到了这一功能。
•此次更新进一步巩固谷歌在智能助手市场的领先地位。
新一代AI图像生成模型Reve Image震撼登场,引领创作新潮流
•Reve Image是一款全新的AI图像生成模型,专注于提升美学表现和提示遵循能力。
•该模型展现出强烈的设计感,生成的作品简洁大气,具有海报风格的视觉冲击力。
•用户反馈其生成能力已足以媲美市场领先技术,且平台设计友好,操作流畅。
全球首个体重管理AI大模型“减单”在合肥发布
•在合肥发布的全球首个体重管理AI大模型“减单”,旨在帮助超重和肥胖患者有效管理体重。
•该模型结合多种数据,能够智能分析饮食情况,提供健康管理建议。
•预计未来三年将覆盖超过1亿名慢性病患者,助力健康管理。
开源实时识别模型RF-DETR:实时识别画面中的物体,开源可商用
•RF-DETR是由Roboflow团队开发的一款开源实时目标检测模型,旨在解决YOLO系列模型在速度和精度上的不足。
•它在COCO数据集上实现了超过60%的平均精度,并且在GPU上具备极低的延迟。
•该模型适用于自动驾驶、工业质检等需要快速反应的场景。
Cloudflare推出“AI迷宫”,引导恶意爬虫走入虚假数据陷阱
•Cloudflare 最新推出的 “AI Labyrinth” 工具旨在通过引导恶意网络爬虫进入虚假页面,打击未经授权的数据抓取行为。
•这一创新措施不仅可以拖延和迷惑爬虫,还能帮助网站管理员识别新的爬虫模式。
•网站管理员可在 Cloudflare 仪表板上启用此功能,未来还将扩展为更复杂的链接网络。
AbletonMCP:调用Ableton的MCP服务,让Claude能够创作音乐
•AbletonMCP 是一款创新工具,通过模型上下文协议将音乐制作软件 Ableton Live 与 Claude AI 连接。
•该系统由 Ableton 远程脚本和 MCP 服务器组成,用户可以通过 Claude 与 Ableton 进行互动。
•此工具提供了一种全新的音乐创作体验,支持多种音轨和剪辑操作。