乐速

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
乐速2025-09-02 11:37678
通义千问登顶Hugging Face榜首，国产开源大模型赶超Llama2
【雷峰网(公众号：雷峰网)消息】上周五，全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜，阿里云通义千问Qwen-72B表现抢眼，以73.6的综合得分在所有预训练模型中排名 ...
乐速2025-09-02 11:152048
被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前，马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看，Grok-1 超越了 70B 的 LLaMA 2，是当前开源模型中最 ...
乐速2025-09-02 11:122503
智谱AI狂飙：与商业化博弈的一年
【雷峰网(公众号：雷峰网)】“这一年时间过得太快了。”2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时，张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红 ...
乐速2025-09-02 11:042618
独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元
近日，关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情，坊间传得沸沸扬扬。雷峰网独家获悉，杨红霞已于 5 月下旬正式从字节跳动离职，开始筹备 AI 创业项目。不过，杨红霞不做“大”模型，而是将方 ...
乐速2025-09-02 11:032929
当「养老」遇上 AI 大模型
作者：赖文昕编辑：陈彩娴鲜少有人关注到这样一个现象：在大模型的发展初期，「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂，新一代大模型产品经理的数量稀少，程序员往往既是技术、又 ...
乐速2025-09-02 11:002295
专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮
2月1日，刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。MiniCPM 2B 有着当之无愧的「小钢炮」 ...
乐速2025-09-02 10:362851
用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑
作者：赖文昕编辑：郭思、陈彩娴说起扩散模型生成的东西，你会立刻想到什么？是OpenAI的经典牛油果椅子？是英伟达Magic3D生成的蓝色箭毒蛙？还是斯坦福大学和微软Folding Diffusion生 ...
乐速2025-09-02 10:262713
用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑
作者：赖文昕编辑：郭思、陈彩娴说起扩散模型生成的东西，你会立刻想到什么？是OpenAI的经典牛油果椅子？是英伟达Magic3D生成的蓝色箭毒蛙？还是斯坦福大学和微软Folding Diffusion生 ...
乐速2025-09-02 09:561504
当「养老」遇上 AI 大模型
作者：赖文昕编辑：陈彩娴鲜少有人关注到这样一个现象：在大模型的发展初期，「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂，新一代大模型产品经理的数量稀少，程序员往往既是技术、又 ...
乐速2025-09-02 09:23793
独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元
近日，关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情，坊间传得沸沸扬扬。雷峰网独家获悉，杨红霞已于 5 月下旬正式从字节跳动离职，开始筹备 AI 创业项目。不过，杨红霞不做“大”模型，而是将方 ...
乐速2025-09-02 09:211217
阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
乐速2025-09-02 09:05589

全站热门

埋头钻研一年后，阶跃星辰交出了第一份答卷

大模型「点火」，AI for Science 提速

牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团

"寻数计划"已发布，面向全社会征集高质量大模型语料数据

国家增长改革委：我国建成超过10亿亩高标准农田

别再声讨零一万物了

埋头钻研一年后，阶跃星辰交出了第一份答卷

浪潮信息彭震：AI+是目标也是机会，要推动AI成为百行千业的生产力

友情链接

乐速

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍

通义千问登顶Hugging Face榜首，国产开源大模型赶超Llama2

被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线

智谱AI狂飙：与商业化博弈的一年

独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元

当「养老」遇上 AI 大模型

专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑

用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑

当「养老」遇上 AI 大模型

独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍

热门标签

全站热门

热门文章