GUI - 搜索 News

1 天on MSN

通义全尺寸GUI智能体基座模型MAI-UI开源

凤凰网科技讯 12月29日，通义实验室多模态交互团队近日宣布开源其通用GUI智能体基座模型MAI-UI。该模型旨在通过理解屏幕界面并执行操作，完成跨应用、多步骤的复杂任务，例如查询车票、在通讯群组同步信息、调整会议安排等。

腾讯网

我们的 GUI Agent 开源了：OMG-Agent，AI 手机我来了

省流：我们基于 AutoGLM 和 GELab-Zero 这类开源 GUI model ，构建了一个 GUI Agent --- OMG-Agent！已开源先是豆包手机证明 AI ...

1 天

通义实验室开源MAI-UI：全新GUI智能体模型引领多模态交互新时代

在数字化迅速发展的今天，用户与技术之间的交互方式正在经历深刻的变革。12月29日，通义实验室的多模态交互团队正式宣布开源其最新的全尺寸GUI智能体基座模型——MAI-UI。该模型的推出，标志着在用户交互能力和复杂任务执行方面又迈出了重要一步。

6 天

OPPO姜昱辰谈AI手机路线：GUI Agent是中间过渡形态，未来将走向A2A

此外，AI入口或许将重新改变硬件和软件生态的商业模式。在谈到和应用企业探索AI合作的未来商业模式变化时，姜昱辰表示，从功能机到智能机时代，手机企业的生态位是变好了，互联网收入或者渠道收入增多，到了AI时代，渠道收入预计仍会存在。“在和智能体探索合作，比如和支付宝的合作探索还在早期，甚至整个行业还处于早期，我们还在技术合作的阶段。” ...

腾讯网

起底“豆包手机”：核心技术探索早已开源，GUI Agent布局近两年 ...

嘻疯发自凹非寺量子位 | 公众号 QbitAI3万台首批备货被一抢而空、在二手市场价格翻番的当红炸子鸡“豆包手机”，更多技术详情得到证实。事实证明，豆包手机助手技术预览版背后，是字节在“系统级GUI ...

太平洋科技资讯中心

OPPO高管谈AI手机发展路径：GUI Agent是过渡形态未来将转向A2A协议

近日，字节跳动与努比亚联合推出的“豆包AI手机”引发关注。该手机通过GUI技术实现跨App操作，但也引发隐私安全担忧。12月22日，快手平台遭黑灰产攻击，加剧了对AI技术安全性的讨论。

5 天on MSN

OPPO 姜昱辰谈 AI 手机发展方向:GUI Agent 为过渡，未来将实现 A2A

近日，OPPO ColorOS 智慧产品研发总监姜昱辰在接受媒体采访时，阐述了 OPPO 在 AI 手机领域的发展路线，强调 GUI Agent 是当前技术的过渡形态未来将更倾向于 Agent to Agent（A2A）模式。此番言论恰逢字节跳动与努比亚联合推出的 “豆包 AI 手机” 引发广泛关注，后者通过语音指令实现跨 App 自动操作，成为行业热点。

电子工程专辑

MCU的TOP15图形GUI库：选择最适合你的图形用户界面（一）

在嵌入式系统开发中，选择一个合适的图形用户界面（GUI）库是至关重要的。在屏幕上显示的时候，使用现成的图形库，这样开发人员就不需要弄清楚底层任务，例如如何绘制像素、线条、形状，如果再高级一点，则可以绘制某些对象，例如窗口、按钮等。

11月

引领人机交互革命？微软研究团队发布80页的大模型GUI智能体综述

近日，微软研究团队发布了一篇长达 80 页、逾 3 万字的综述论文《Large Language Model-Brained GUI Agents: A Survey》。这份综述系统梳理了大模型驱动的 GUI 智能体在现状、技术框架、挑战与应用等方面的研究进展。论文指出，通过将大语言模型（LLMs）与多模态模型（Visual Language Models, VLMs）相结合，GUI ...

10 天

Andrej Karpathy 年度总结：Nano Banana最为震撼，指向下一代 AI GUI 的雏形

Google Gemini Nano Banana 是 2025 年最令人震撼、最具范式转移意义的模型之一。在我的世界观里，LLM 是继 1970、80 ...

13 天

前述内容由第一财经“星翼大模型”智能生成，相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别，第一财经不承担由此产生的任何责任。如您有疑问或需要更多信息，可以联系我们 [email protected] 阶跃星辰宣布GUI Agent全面升级阶跃星辰今日宣布GUI Agent全面升级，包括云端模型Step-GUI全量上新，任务场景突破200+，支持超长步骤推理，并开放GUI-MCP ...

来自MSN

智谱技术开源CogAgent-9B模型，赋能AI智能体精准“解读”GUI界面

近日，智谱技术团队在官方公众号上宣布了一项重大进展，正式开源了名为CogAgent-9B-20241220的基座模型。这款模型是基于GLM-4V-9B进行训练的，专为智能体（Agent）任务设计，具有极高的实用价值。 CogAgent-9B-20241220的最大特点是其独特的输入方式。与以往需要HTML等 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果