阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
date:2025-08-29 03:53  praise:  views:463
不仅仅是「GPTs」,支付宝在做一种很新的智能体
9 月 5 日,外滩大会上,蚂蚁集团大模型应用负责人顾进杰完成了演讲,最后一页 PPT 上的唯一一句话是:让我们一起,推开智能体商业时代的大门。他在这段演讲中,透露了支付宝的一个重要动作:启动智能体生 ...
date:2025-08-29 03:06  praise:  views:725
AI 搜索向左,搜索 OG 向右
作为 AI 世界的领头羊,OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。这把火原本由 Perplexity 引燃,在美国烧及 Google 和微软,在中国引发了百度、360 ...
date:2025-08-29 02:56  praise:  views:509
OpenAI 终于发布 GPT
美国时间 7 月18 日,OpenAI 正式发布了多模态小模型 GPT-4o mini,在海内外引起了广泛关注。此前,OpenAI 凭借 GPT-3 开拓了 AI 模型的“暴力美学”时代,同时也以训练 ...
date:2025-08-29 02:52  praise:  views:2903
"寻数计划"已发布,面向全社会征集高质量大模型语料数据
一、“寻数计划”简介如果您有大模型所需的丰富语料数据资源,如果您有标准化的高质量精标语料数据产品,如果您愿意以多元化方式参与大模型高水平语料数据要素建设,诚邀您加入“寻数计划”。“寻数计划”是大模型语 ...
date:2025-08-29 02:18  praise:  views:1399
亚马逊 8000 万美元收购 Perceive AI;昆仑万维发布首个 AI 短剧平台;百川智能成立新公司丨AI情报局
今日融资快报AMD以49亿美元收购服务器制造商ZT Systems据报道,AMD已同意以49亿美元现金和股票交易收购人工智能基础设施集团ZT Systems,此举延续了该芯片公司在人工智能领域的投资势 ...
date:2025-08-29 02:06  praise:  views:1572
GPT未竟的革命,由o1接棒:或是LLM研究最重要的发现
天下武功唯快不破,但 OpenAI 不走寻常路,新出的 o1 系列宣告天下:我们更慢,但更强了。o1 要花更多的时间思考问题,再做出反应,但在复杂推理层面直接窜了几个档位。在国际数学奥林匹克 (IMO ...
date:2025-08-29 01:53  praise:  views:2823
阶跃星辰开放平台迎来多项更新,上线 Step
近日,大模型创业公司阶跃星辰在其开放平台体验中心,正式上线了图像生成大模型 Step-1X,注册即可体验。指路链接:https://platform.stepfun.com/console-tools ...
date:2025-08-29 01:45  praise:  views:2423
独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元
近日,关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情,坊间传得沸沸扬扬。雷峰网独家获悉,杨红霞已于 5 月下旬正式从字节跳动离职,开始筹备 AI 创业项目。不过,杨红霞不做“大”模型,而是将方 ...
date:2025-08-29 01:44  praise:  views:600
亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践
以大模型为代表的新一代人工智能技术变革仍在加速迭代,为“新质生产力”的发展注入强劲动力,助力产业智能化升级和经济发展。目前,大模型在产业端,已经开始从任务简单、容错率高的场景向任务复杂、容错率低的场景 ...
date:2025-08-29 01:33  praise:  views:208