看台

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
看台2025-08-27 10:581745
AI Infra 往事之异构计算篇：吴韧与他的学生们
2013年9月底，吴韧受百度邀请，以杰出科学家的身份加入百度深度学习研究院IDL），此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年，当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后 ...
看台2025-08-27 10:50779
MediaTek 举办天玑开发者大会 MDDC2024，携手产业伙伴共创生成式 AI 新生态
2024年5月7日，MediaTek 举办天玑开发者大会2024MDDC 2024），本届大会以“AI予万物”为主题，深入研讨生成式 AI 技术为移动生态带来的变革与全新机遇。会上，MediaTek ...
看台2025-08-27 10:412170
MediaTek 举办天玑开发者大会 MDDC2024，携手产业伙伴共创生成式 AI 新生态
2024年5月7日，MediaTek 举办天玑开发者大会2024MDDC 2024），本届大会以“AI予万物”为主题，深入研讨生成式 AI 技术为移动生态带来的变革与全新机遇。会上，MediaTek ...
看台2025-08-27 10:26497
通义千问登顶Hugging Face榜首，国产开源大模型赶超Llama2
【雷峰网(公众号：雷峰网)消息】上周五，全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜，阿里云通义千问Qwen-72B表现抢眼，以73.6的综合得分在所有预训练模型中排名 ...
看台2025-08-27 10:182033
当「养老」遇上 AI 大模型
作者：赖文昕编辑：陈彩娴鲜少有人关注到这样一个现象：在大模型的发展初期，「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂，新一代大模型产品经理的数量稀少，程序员往往既是技术、又 ...
看台2025-08-27 10:091668
谁将替代 Transformer？
【雷峰网(公众号：雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经，此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...
看台2025-08-27 09:422893
被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前，马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看，Grok-1 超越了 70B 的 LLaMA 2，是当前开源模型中最 ...
看台2025-08-27 09:28793
大模型生产力的头场变革，从英特尔商用 AI PC 说起
作者丨郭思编辑丨陈彩娴「水利万物而不争。」这是英特尔公司高级副总裁、英特尔中国区董事长王锐女士常说的一句话，看似没有压迫性，却切实点出了英特尔作为 AI PC 概念提出者，这场大语言模型技术革命中的思 ...
看台2025-08-27 09:241017
共襄学术盛宴，共话产业发展，2024中国图象图形大会在西安圆满落幕
2024年5月24-26日，中国图象图形大会CCIG 2024）在西安隆重召开。本次大会由中国图象图形学学会主办，空军军医大学、西安交通大学、西北工业大学承办，陕西省生物医学工程学会、陕西省图象图形学 ...
看台2025-08-27 09:202652
大模型时代的三道鸿沟：数据、成本与想象力
跨入2023年，大模型兴起、诸多公司「跑步进场」的头几个月，大模型一边倒向 C 端类 ChatGPT 的研发，对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月，情况发生了变化。基于医疗、金融 ...
看台2025-08-27 09:192994
Pieter Abbeel 新工作“大世界模型”：轻松玩转1小时长视频，一对一QA视频内容细节
作者：赖文昕编辑：陈彩娴自3天前Sora发布以来，由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。“世界模型”作为Sora的一大核心亮点，被OpenAI写在 ...
看台2025-08-27 09:05477

全站热门

上海交大新跑出一家具身智能公司「穹彻智能」

周伯文：下一代大模型 OS，工具和语言缺一不可丨GAIR 2023

博搏云的生态蓝图：稳固住AGI全栈服务商的重要阵地

从 0 到 1，揭秘中国首个 AI 音乐 SOTA 模型

问鼎「AI 之巅」，第四届全国人工智能大赛决赛在深举行

“寒冬”还是“拂晓”？第四范式成功上市率先交卷

通用3D机器视觉平台是不是伪命题？

独家丨前微软 NLP 大牛姜大昕创立新公司「阶跃星辰」

友情链接

看台

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍

AI Infra 往事之异构计算篇：吴韧与他的学生们

MediaTek 举办天玑开发者大会 MDDC2024，携手产业伙伴共创生成式 AI 新生态

MediaTek 举办天玑开发者大会 MDDC2024，携手产业伙伴共创生成式 AI 新生态

通义千问登顶Hugging Face榜首，国产开源大模型赶超Llama2

当「养老」遇上 AI 大模型

谁将替代 Transformer？

被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线

大模型生产力的头场变革，从英特尔商用 AI PC 说起

共襄学术盛宴，共话产业发展，2024中国图象图形大会在西安圆满落幕

大模型时代的三道鸿沟：数据、成本与想象力

Pieter Abbeel 新工作“大世界模型”：轻松玩转1小时长视频，一对一QA视频内容细节

热门标签

全站热门

热门文章