算子简报
2025-04-24 · 算子简报
OpenAI推出gpt-image-1 API,开启图像生成新篇章
•OpenAI最近发布了gpt-image-1图像生成API,开发者可以将这一先进技术轻松集成到各种应用中。
•该功能自上线以来,吸引了大量用户,生成了超过7亿张图像。
•gpt-image-1不仅支持多种图像风格,还内置安全护栏,确保生成内容符合公司政策。
谷歌Gemini月活跃用户突破3.5亿,仍与ChatGPT存在差距
•谷歌的人工智能聊天机器人Gemini在过去一年中实现了显著的用户增长,月活跃用户数达到了3.5亿。
•日活跃用户数也从900万增至3500万,显示出良好的市场接受度。
•然而,与市场领先者ChatGPT的6亿月活跃用户相比,Gemini仍有差距。
OpenAI预测2029年收入激增至1250亿美元
•OpenAI近期发布的收入预测显示,到2029年,其总收入预计将达到1250亿美元。
•AI代理业务和渠道收入将成为主要驱动力,推动公司持续增长。
•2023年,OpenAI的收入达到37亿美元,周活跃用户超过5亿,显示出显著增长。
Ostris发布Flex.2-preview,革新ComfyUI工作流
•Ostris团队推出了Flex.2-preview,这是一款基于8亿参数的文本到图像扩散模型。
•该模型在图像生成的控制能力上表现卓越,支持多种功能如图像修补和深度控制。
•Flex.2-preview已在Hugging Face开源,迅速吸引了AI艺术创作社区的关注。
英伟达推出多模态LLM Describe Anything,提升图像描述能力
•NVIDIA AI团队推出的Describe Anything3B(DAM-3B)模型在多模态学习领域引起了广泛关注。
•该模型能够根据用户指定的图像或视频区域生成详细描述,超越了传统图像标注的局限性。
•NVIDIA开源了DAM-3B的代码、模型权重和数据集,推动了多模态AI研究的透明性和社区协作。
纳米AI发布MCP万能工具箱,简化AI工具集成与调用
•纳米AI推出的MCP万能工具箱旨在简化Model Context Protocol的配置复杂性,提供一站式解决方案。
•该工具箱预配置了100多个MCP服务和18个常用API密钥,支持多种功能如图像、音频和视频生成。
•其发布引发了AI开发者社区的广泛关注,社区反馈积极,认为其高效性与易用性显著提升了开发者的工作效率。
腾讯云代码助手CodeBuddy推出Craft软件开发智能体
•腾讯云于4月24日发布了全新升级的代码助手CodeBuddy,推出Craft软件开发智能体。
•此工具将AI编程从简单的代码补全提升至项目交付,显著提高了开发效率。
•Craft支持MCP协议,实现代码的无缝接入测试、构建和部署,兼容腾讯生态系统。
昆仑万维开源Skywork-R1V 2.0版本,提升多模态推理能力
•昆仑万维于4月24日发布了其多模态推理模型Skywork-R1V2.0,显著提升了视觉与文本推理能力。
•该模型在多个权威基准测试中刷新了开源SOTA纪录,展现出与商业闭源模型相媲美的能力。
•R1V2.0的开源为全球开发者和研究者提供了强大的工具,推动了多模态生态的建设。
智谱宣布旗下多款大模型产品降价,GLM-4-Plus降价90%
•智谱BigModel开放平台于4月24日宣布其多款大模型产品价格大幅调整,进入了“亿时代”。
•此次调整包括GLM-4-FlashX、GLM-Z1系列和GLM-4-Plus等多个产品,特别是GLM-4-Plus的降价幅度高达90%。
•此次降价使企业能够以低成本接触到先进的AI技术,满足多行业场景需求。
JSON Visuals for ChatGPT发布,解锁无限图像风格创作
•JSON Visuals for ChatGPT的发布为图像生成带来了全新的创意维度。
•用户可以利用超过50种美学代码和随机化器,轻松生成个性化的视觉内容。
•该工具不仅提升了生成的灵活性,还支持高分辨率输出,适用于多个领域。
中国成为全球AI专利最大拥有国,占比达60%
•在国务院新闻办公室的发布会上,国家知识产权局局长申长雨宣布,中国在人工智能领域展现出强劲的发展势头。
•中国已成为全球AI专利的最大拥有国,专利数量占全球总量的60%。
•这一成就反映了科技创新的突破,彰显了中国在新兴产业中的领导地位。
小米新款智能音箱发布,AI大模型加持,智能对话再升级
•小米新款智能音箱以199元的亲民价格正式发布,虽然在硬件配置上有所精简,但其AI大模型的引入显著提升了智能交互体验。
•新音箱支持连续对话与指令语控,用户能够更高效地操控智能家居。
•外观设计延续Pro版简约风格,采用清爽浅灰色外壳,尺寸更小巧。