- 阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
- 编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
- date:2025-08-29 13:40 praise: views:2613
- 别再说国产大模型技术突破要靠 Llama 3 开源了
- 【雷峰网(公众号:雷峰网)】近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。Meta 表示,Llama 3 已经在多种行业基准测试上展现了 ...
- date:2025-08-29 13:21 praise: views:1765
- SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展
- 12月13日,以“新算力 新赋能 新未来”为主题的2022 CCF全国高性能计算学术年会CCF HPC China 2022)在线上正式召开。作为高性能计算领域全球最具影响力的三大超算盛会之一,大会邀 ...
- date:2025-08-29 13:10 praise: views:54
- 2024年IEEE Fellow名单揭晓:「视觉智能」领域十余位华人学者入选!
- 近日,国际电气与电子工程师协会IEEE)公布了2024年新晋Fellow名单。本次共从被提名的949名候选人中选出323名IEEE Fellow,其中华人学者有116位,占总人数的36%左右。IEEE ...
- date:2025-08-29 12:41 praise: views:1356
- 谁将替代 Transformer?
- 【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...
- date:2025-08-29 12:40 praise: views:2066
- 大模型时代的三道鸿沟:数据、成本与想象力
- 跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融 ...
- date:2025-08-29 12:33 praise: views:421
- 对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型
- 作者丨王悦编辑丨董子博“今年的数字人市场迎来了天翻地覆的变化。”中科深智创始人成维忠对目前国内的数字人市场如是评价。过去,国内数字人企业真正做技术的并不多,大部分以IP打造为主。出道即巅峰的虚拟美妆达 ...
- date:2025-08-29 12:14 praise: views:450
- SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展
- 12月13日,以“新算力 新赋能 新未来”为主题的2022 CCF全国高性能计算学术年会CCF HPC China 2022)在线上正式召开。作为高性能计算领域全球最具影响力的三大超算盛会之一,大会邀 ...
- date:2025-08-29 12:10 praise: views:460
- “南京红老头”已被警方抓获
- 来源:法治日报[南京红姐被抓]记者从警方相关人士处了解到,网上盛传的南京60岁大叔男扮女装与1691名男性发生亲密行为并拍下“约会”视频的涉事男子网上被称为“红老头”)已经被公安机关抓获。其中,网上传 ...
- date:2025-08-29 11:50 praise: views:1040
- 昆仑万维开源「天工」13B系列大模型,0门槛商用
- 10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...
- date:2025-08-29 11:44 praise: views:444