都2024了，这些人工智能英文黑话必须懂！｜融云数字服务社区丨榕媒圈BrandCircle

人工智能时代已经到来！

这个时代人人都讨论人工智能，Sora、ChatGPT、AGI、AIGC、LLM、DL、Transformer，什么？这些词你还不懂什么意思？

都2024了，不管你是否真的懂人工智能，以下这些人工智能英文黑话，你必须要懂了！

CHATGPT：OpenAI开发的语言模型

用于自然语言处理和文本生成任务。这个模型可以理解大量的自然语言输入，并产生符合上下文的输出。CHATGPT被广泛应用于聊天机器人、智能客服、文章摘要等领域。

Sora：人工智能文生视频大模型

目前最火的人工智能文生视频大模型！它能够根据用户输入的提示词、文本指令或静态图像，来创造出长达一分钟的逼真且充满想象力的视频场景。

OpenAI：ChatGPT和Sora的母公司

2015年，OpenAI由埃隆·马斯克(Elon Musk)、山姆·阿尔特曼(Sam Altman)、彼得·泰尔(Peter Thiel)和里德·霍夫曼(Reid Hoffman)等六人联合创办，最初为非营利性机构。2018年，马斯克宣布退出。2019年，OpenAI宣布重组为一家“有限营利(capped-profit)企业”，并接受了微软10亿美元的投资。2022年11月30日，OpenAI上线了人工智能新模型ChatGPT。2023年3月15日凌晨，0penAI发布了多模态预训练大模型GPT-4。2024年2月16日发布文生视频模型Sora。

AIGC：Artificial Intelligence Generative Content人工智能生成内容

它是一种基于机器学习和自然语言处理的技术，AI接收到人下达的任务指令，通过处理人的自然语言，能够自动产生文本、图像、音频等多种类型的内容。

AGI：Artificial General Intelligence通用人工智能

AGI是指一种具有广泛认知能力的AI，是AI发展的一个更高级阶段，指的是机器能够像人类一样学习各种知识，完成各种任务。也可以说AGI的目标是使AI能够像人类一样具有通用的学习、推理和适应能力。

ASI：Artificial Super Intelligence超级人工智能

超越人类智慧的人工智能，在各个领域都比人类聪明，可以执行任何智力任务并且在许多方面超越人类。最早由英国教授尼克(NickBostrom)定义: “一种几乎在每一个领域都胜过人类大脑的智慧。”

LLM：Large Language Model语言大模型

是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。LLM 通常基于神经网络模型，使用大规模的语料库进行训练，比如使用互联网上的海量文本数据。这些模型通常拥有数十亿到数万亿个参数，能够处理各种自然语言处理任务，如自然语言生成、文本分类、文本摘要、机器翻译、语音识别等。

Prompt：指令信息

通常指的是一个输入的文本段落或短语，作为生成模型输出的起点或引导。prompt 可以是一个问题、一段文字描述、一段对话或任何形式的文本输入，模型会基于 prompt 所提供的上下文和语义信息，生成相应的输出文本。

Corpus：语料

通常是指一定数量和规模的文本资源集合，是构成语料库的基本单元。在大语言模型中，语料被分解为Token和各种向量关系，通过预训练的方式，人们基于这些Token和向量关系，建立起各种参数和模型，成为可被AI“消化、吸收”的原始学习素材。语料是大语言模型的原材料，是大语言模型能够消化的输入。Chatgpt就用到了至少3000亿的语料数据。

Token：数据单元

大模型用于处理和生成文本的文本单位，比如英文单词或汉字。通常来说，一个单词就是一个token。当用户输入文本后，ChatGPT会使用分词算法将每个输入的单词拆分成token。在自然语言处理（NLP）中，token是指文本中最小的语义单元。

NLP：Natural Language Processing自然语言处理

NLP是用计算机来分析和生成自然语言（文本、语音），目的是让人类可以用自然语言形式跟计算机系统进行人机交互，从而更便捷、有效地进行信息管理。NLP就是机器语言和人类语言沟通的桥梁。

NLU：Natural Language Understanding自然语言理解

是指计算机对自然语言文本进行分析处理从而理解该文本的过程、技术和方法。从微观角度，NLU是指从自然语言到机器内部的一个映射。从宏观角度，自然语言理解是指机器能够执行人类所期望的某种语言功能，这些功能主要包括回答问题、文摘生成、释义、翻译几方面。

GAN：Generative Adversarial Network生成对抗网络

一种机器学习系统，由生成器（Generator）和判别器（Discriminator）组成，生成器的任务是制造逼真的数据（如图像），而判别器则尝试区分这些生成的数据和真实的数据。通过这种对抗性的训练，生成器学会制造越来越逼真的数据，而判别器则变得更擅长于识别真伪。两个模型相互博弈，通过不断的对抗和学习来提高生成器生成能力。

ML：Machine Learning机器学习

机器学习是人工智能的一个分支，作为一种人工智能技术，使用数据和算法来让计算机自动“学习”，从而自动执行特定任务。机器学习的目标是使计算机能够从数据中自动推断出规律，并基于这些规律来做出预测或决策。

DL：Deep Learning深度学习

深度学习是机器学习的一个重要分支，是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

RPA：Robotic Process Automation机器人流程自动化

指用软件自动化方式模拟人工完成计算机终端的操作任务，让软件机器人自动处理大量重复的、基于规则的工作流程任务。其优势和价值主要体现在无编码、学习成本低、开发周期短；非侵入式，对现有IT架构基本无影响；提升工作质量，减少重复人工操作，可７ｘ２４小时不间断工作；安全性高，减少人为失误；解放人力，释放人员从事更具有创造性的工作内容，降本增效。RPA能将重复的工作流程自动化完成，不再需要人工来耗费大量的时间和精力完成。

GPU：Graphics Processing Unit图形处理单元

GPU是计算机显卡的核心芯片，主要负责处理和渲染图像，从而让显示器显示出来。GPU的工作原理是通过大量的并行运算来完成图形处理任务。现在越来越多的应用到了深度学习与人工智能等需要并行处理大量数学运算的场景。在GPU中缓存单元大概占5%，控制单元5%，运算单元90%。

CPU：Central Processing Unit中央处理单元

CPU：是计算机的运算和控制核心，可以理解为PC及服务器的大脑。CPU的本质是一块超大规模的集成电路，主要功能是解释计算机指令以及处理计算机软件中的数据。在CPU中缓存单元大概占50%，控制单元25%，运算单元25%。

A100 : A100是NVIDIA在2020年发布，是首款采用Ampere架构的GPU，采用台积电为英伟达定制的7 nm工艺，拥有540亿个晶体管。在H100出现前是最适合训练大模型的芯片。

H100：H100 是一款针对大模型专门优化过的芯片，使用台积电 4nm 定制版本制程（4N）打造，单块芯片包含 800 亿晶体管。相较于前任 A100，H100 单卡在推理速度上提升 3.5 倍，在训练速度上提升 2.3 倍；如果用服务器集群运算的方式，训练速度更是能提高到 9 倍，原本一个星期的工作量，现在只需要 20 个小时。

Turing test图灵测试

以著名数学家和计算机科学家艾伦·图灵命名，测试机器的类人行为能力。如果人类无法将机器的反应与其他人的反应区分开来，机器就通过了测试。图灵测试经常被用作评估人工智能研究进展的基准。

ANN：Artificial Neural Network人工神经网络

ANN简称神经网络（neural network，NN）或类神经网络，在机器学习和认知科学领域，是一种模仿生物神经网络（动物的中枢神经系统，特别是大脑）的结构和功能的数学模型或计算模型，用于对函数进行估计或近似。

CNN：Convolutional Neural Network卷积神经网络

卷积神经网络是一种深度学习网络，主要用于识别图像和对其进行分类，以及识别图像中的对象。CNN 已成为许多先进深度学习（例如面部识别、手写识别和文本数字化）方面的计算机视觉应用程序的首选模型。

Transformer：一种深度学习模型

“Transformer”是一种融入注意力机制和神经网络模型领域的主流模型和关键技术。Transformer具有将所处理的任何文字和句子“向量”或者“矢量”化，最大限度反映精准意义的能力。由于其优秀的性能和灵活性，它现在被广泛应用于各种自然语言处理（NLP）任务。Transformer模型最初由Vaswani等人在2017年的论文”Attention is All You Need”中提出。

往期推荐：

创造万亿字节跳动，张一鸣231条思考干货，想成功的创业者都值得学习一遍

经纬张颖：给科研技术背景创始人的19条创业建议（整理）

文章版权归原作者所有，未经允许请勿转载。

THE END