人工智能
-
WordPress推出了一个全新的 AI 建站工具 任何人都能快速创建并发布自己的网站
文字派.推出一個全新 AI 网站构建器〔AI Website Builder〕,这是一個根据人工智能工具,旨在帮助运用者高速创建专业网站,无需 coding 经...
-
OpenAI发布了三个新模型:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano
OpenAI 以API 格局发布三个新模型:GPT-4.1、GPT-4.1 mini 、 GPT-4.1 nano。这些模型性能全面超越 GPT-4o 、 GP...
-
智谱发布新一代开源模型 GLM 系列 32B性能媲美 671B的Deepseek R1 并宣布启动IPO
智谱宣布全面开源其新一代大语言模型 GLM 系列,涵盖以下三款核心模型:推理模型 GLM-Z1-Air沉思模型 GLM-Z1-Rumination基座模型 GL...
-
大语言模的扩展法则
本文介绍KM扩展法则 和 Chinchilla扩展法则先用简单的比喻给介绍一下:你可以想象在做饭:KM扩展法则就像是说:“想做出更好吃的饭,先要买一个更大的锅!...
-
大语言模型的构建过程是怎样的?
我用两种方式分别解释下,分别是通俗易懂的大白话比喻和专业的学术性解释通俗易懂的解释想象一下,你要教一个机器人如何当你的助手。1. 大规模预训练就像你先给这个机器...
-
大语言模型对科技发展的影响
近年来,大语言模型(Large Language Models, LLMs)如同一组自我生长的算法星座,在 Transformer 这一架构骨架之上,以参数级数...
-
大语言模型关键技术概览:从扩展规模到人类对齐的系统工程
在通往通用人工智能〔AGI〕征途中,大语言模型〔LLM〕已变成重心驱动力,其根本工艺演进涵盖多個维度,构成一条复杂而惊险工艺轨迹。先说是规模扩展〔Scaling...
-
大语言模型的能力特点:通识智能迈向AGI的关键跃迁
近年来,根据Transformer架构浩大语言模型〔Large Language Models,LLMs〕在人工智能行业掀起一场震撼性革命,百分之百打破咱们对“...
-
语言模型发展历程:从统计方法到大模型时代
语言模型的演化历程可谓跌宕起伏,跨越了多个阶段:从早期的统计语言模型的朴素起步,到如今深度学习的强大驱动,再到当下席卷一切的大型语言模型。这一历程,不仅见证了技...
-
超越自回归:迈向具备规划与推理能力的下一代语言智能体系
置于当代自然语言处理(Natural Language Processing, NLP)研究的宏观语境之中,自回归语言模型(Autoregressive Lan...
-
美股全线暴跌,英伟达市值蒸发即将完蛋!
北京时间4月4日晚,美股开盘三大指数集体下跌,截至发稿前,道指重挫超1400点,跌幅3.48%,纳指下跌4.47%,标普500指数下跌4.10%。大型科技股普跌...
-
DeepSeek R2震撼提前发布!DeepSeek-GRM起飞了
强化学习 (RL) 已广泛应用于大规模语言模型 (LLM) 的后期训练。最近,RL 对 LLM 推理能力的激励表明适当的学习方法可以实现有效的推理时间可扩展性。...
-
字节跳动新项目 DreamActor-M1
DreamActor-M1:由字节跳动开发的一种基于Diffusion Transformer(DiT)的人像动画生成框架,可以根据参考图片和驱动视频生成高质量...
-
Dream 7B(扩散推理模型),迄今为止最强大的开源扩散大语言模型
团队:叶家成*、谢志辉*、郑霖*、高佳辉*、吴子睿、姜鑫、李政国、孔令鹏机构:香港大学、华为诺亚方舟实验室介绍 Dream 7B在与华为诺亚方舟实验室联合奋勉下...
-
小心AI开始胡说八道 当生成式AI的“虚构能力”突破边界,我们该如何保持清醒?
生成式AI技术突飞猛进,其“虚构能力”日益引发关注近期,两封引发行业震动的信件在社交平台流传:一封署名为英伟达CEO黄仁勋的内部信点评国产大模型,另一封则是“D...