爐邊夜話——深入淺出話AI

簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書始終圍繞著人工智能(AI)的本質(zhì)及原理進(jìn)行講解,循序漸進(jìn)地探索了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)以及大模型等AI的核心原理。
它們的技術(shù)根基可以進(jìn)一步回溯到統(tǒng)計概率論、線性代數(shù)、微積分、最優(yōu)化理論等學(xué)科,而本書將生硬的基礎(chǔ)數(shù)學(xué)原理通過客觀世界娓娓道來,幫助讀者克服學(xué)習(xí)AI的障礙,讓復(fù)雜的理論變得易于消化,讓抽象的概念變得具體可感。
無論你是人工智能領(lǐng)域的新人,抑或是有一定經(jīng)驗的研究者,本書能成為你探索AI世界的得力助手。
你在學(xué)習(xí)AI的道路上可能積累了很多的無法理解
包括但不限于概念、算法原理、數(shù)學(xué)實現(xiàn)細(xì)節(jié)等方面
你可能初入AI
便陷入了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、NLP、ChatGPT、AI、AIGC、LLM等領(lǐng)域的包圍
分不清誰是誰、哪跟哪,突然不知道AI應(yīng)從何學(xué)起、如何學(xué)起
那么,你不應(yīng)該錯過這本書
隨著大模型掀起的新一輪人工智能滔天巨浪,以ChatGPT為代表的大模型產(chǎn)品正以驚人的速度滲透著我們生活的方方面面,從工作到娛樂,從學(xué)習(xí)到社交,幾乎無孔不入。對于多數(shù)普通民眾來說,初次被人工智能(Artificial Intelligence,AI)所震撼估計是2016年阿爾法狗(AlphaGo)的橫空出世,AlphaGo擊敗圍棋世界冠軍讓我們覺得機(jī)器的整體智力很快就會超越人類。此后人工智能沉寂了一段時間,直到2022年年底ChatGPT的出現(xiàn),再次吸引了全球民眾的眼球,一個具備很高智能的機(jī)器人正在與這個世界對話。那么,下一個讓我們震撼的人工智能事件又會是什么呢?
實際上,人工智能并非是近些年才有的新鮮事物,早在1956年就被正式提出,至今已經(jīng)發(fā)展了68年了。人工智能的發(fā)展雖然十分曲折卻也波瀾壯闊,在人工智能被提出來后,它的前景吸引了很多人投身該領(lǐng)域,但卻在發(fā)展過程中經(jīng)歷了多個“寒冬”。好在“寒冬”并沒有徹底澆滅人工智能的火苗,而是在每個“寒冬”階段都向前邁一步。
人工智能就是人工地去制造智能。想要創(chuàng)造出像人一樣的智能就必須先深入理解智能,而人類的智能就藏在大腦中,所以創(chuàng)造智能最好的路徑就是徹底弄清人類大腦中每部分的組成及運(yùn)作機(jī)制,這樣就可以制造一個“大腦”來實現(xiàn)人類的智能。但這種方式并非主流的方法,因為我們的大腦實在是太復(fù)雜了,甚至可以說比整個宇宙還復(fù)雜,當(dāng)前人類對我們自己大腦的認(rèn)知還是太淺了。然而這堵墻并沒有擋住人類前進(jìn)的腳步,既然無法徹底搞清大腦,那就去模擬吧!實際上智能就是一種“輸入—輸出”模型,通過某一種輸入來產(chǎn)生一種輸出。通過構(gòu)建某種人工智能算法來實現(xiàn)輸入到輸出的映射或生成,這樣就成功模擬出智能了,這也是當(dāng)前主流的人工智能實現(xiàn)方式。
人工智能的運(yùn)作原理是什么?我相信大多數(shù)人都會產(chǎn)生這種好奇心。十年前,正是這種好奇心讓我走上了人工智能的研究道路。我現(xiàn)在依然清晰地記得剛接觸到人工智能時自己內(nèi)心的好奇與興奮,縱使當(dāng)時AI還沒達(dá)到如今“大模型”的震撼效果,但機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的各種神奇的AI算法已經(jīng)深深地吸引了我,于是我決定一定要弄清人工智能這個黑盒子里面裝的到底是什么。此后在多年的時間里我研究了人工智能領(lǐng)域主要的論文和書籍,并且一直從事人工智能的研發(fā)工作,對人工智能的原理機(jī)制有了深層次的理解。身處人工智能時代,理解人工智能的運(yùn)作機(jī)制是十分有必要的,知道一個事物和知道一個事物如何運(yùn)作是完全不一樣的,后者能讓我們思考得更深,走得更遠(yuǎn)。
回溯我的學(xué)習(xí)經(jīng)歷,我深感在AI領(lǐng)域前行不易。面對晦澀難懂的理論、紛繁復(fù)雜的算法,可以說是充滿了挑戰(zhàn)與困惑。從最初對基本概念的迷茫,到逐漸理解復(fù)雜算法背后的原理,每一步都充滿了坎坷。猶記得初次接觸機(jī)器學(xué)習(xí)時,面對浩瀚如海的數(shù)學(xué)公式和專業(yè)術(shù)語,我猶如迷路的旅者在繁星點點的知識天空下茫然四顧。有時卡在某些知識點上毫無頭緒且久久不得其意,這是一種對知識求而不得的無力感。人工智能的很多知識都是環(huán)環(huán)相扣且背后都是由數(shù)學(xué)驅(qū)動的,就好比我要理解卷積神經(jīng)網(wǎng)絡(luò)識別圖像的原理,那就會涉及圖像處理、卷積運(yùn)算和神經(jīng)網(wǎng)絡(luò),而圖像處理又涉及矩陣運(yùn)算,神經(jīng)網(wǎng)絡(luò)又涉及函數(shù)、偏導(dǎo)數(shù)和梯度下降等,最終我們都不得不回歸到更基礎(chǔ)的數(shù)學(xué)原理上。這個過程就像在攀登一座高山,通往頂峰的道路層層疊疊且蜿蜒曲折,每一步都充滿艱辛。不過當(dāng)我們在山頂回頭看時,總能看到更壯麗的風(fēng)景。
我相信,在探索人工智能之旅中我所遇到的困難和疑惑,也是所有初學(xué)者所面臨的共同的問題。于是我萌生了一個念頭:撰寫一本能夠幫助大家循序漸進(jìn)地探索人工智能原理的書籍。這本書要由表及里地、深入淺出地講解人工智能的原理,而且要將生硬的基礎(chǔ)數(shù)學(xué)原理通過客觀世界有理有據(jù)地引入進(jìn)行講解。這本書應(yīng)該就是一個高級智能體,將人工智能的奧秘娓娓道來!它將幫助讀者克服學(xué)習(xí)人工智能的障礙,讓復(fù)雜的理論變得易于消化,讓抽象的概念變得具體可感。
親愛的讀者,無論你是人工智能領(lǐng)域的新人,抑或是有一定經(jīng)驗的研究者,我都由衷地希望本書能成為你探索人工智能世界的得力助手。在這本《爐邊夜話—深入淺出話AI》中,我將與你分享一段奇妙的旅程,一段探索機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)以及大模型人工智能交織而成的智慧宇宙之旅。這些領(lǐng)域雖看似龐雜且深奧,但它們的技術(shù)根基可以回溯到統(tǒng)計概率論、線性代數(shù)、微積分、最優(yōu)化理論等學(xué)科。正是這些基石支撐起了人工智能算法的框架,賦予了各種神經(jīng)網(wǎng)絡(luò)智能能力。在探索的過程中或許你會遇到困難,但請記住每一次挑戰(zhàn)都是成長的機(jī)會。
下面詳細(xì)介紹本書的內(nèi)容脈絡(luò)。
人類的智能是如何形成的?從RNA和蛋白質(zhì)開始,單細(xì)胞逐步到多細(xì)胞后才慢慢進(jìn)化并匯聚成脊髓,最后才發(fā)展出了大腦。人腦不斷進(jìn)化變成非常復(fù)雜的“三磅宇宙”,這個小宇宙中的秘密至今人類都無法完全解開。但我們已經(jīng)知道它的基礎(chǔ)組成結(jié)構(gòu)就是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),數(shù)百上千億的神經(jīng)元通過互相連接而產(chǎn)生超級大腦。人類沒有停止過對大腦的模擬,因此很久以前就提出了“人工智能”的概念,它要完成的任務(wù)是創(chuàng)造出人一樣的智能,現(xiàn)如今人工智能已經(jīng)發(fā)展成一門炙手可熱的學(xué)科。然而要實現(xiàn)人工智能就離不開計算機(jī),而計算機(jī)的理論基礎(chǔ)則是圖靈機(jī),研究人工智能就必須了解計算機(jī)的工作原理。計算機(jī)的微觀世界就是成群的邏輯電路,它們能夠執(zhí)行現(xiàn)實世界復(fù)雜的模型運(yùn)算。我們要將現(xiàn)實世界裝進(jìn)計算機(jī)就需要一些建模方法,通�;跀�(shù)學(xué)進(jìn)行建模。在明確規(guī)則的情況下我們可以直接用數(shù)學(xué)描述,而當(dāng)規(guī)則無法確定時則通過數(shù)據(jù)驅(qū)動數(shù)學(xué)模型來解決。我們身處于一個異常復(fù)雜的世界,很多事情都是不確定的,此時就要通過概率思維來解決。我們的世界很多現(xiàn)象也符合一定的概率分布,比如正態(tài)分布、均勻分布和伯努利分布等。
我們再回到人工智能的核心問題,基于數(shù)學(xué)對智能建模后實際上最終都還是要回歸到尋找最優(yōu)解的問題上,所以可以說人工智能本質(zhì)上就是一個最優(yōu)化過程。那么要怎么才能找到最優(yōu)解呢?此時就要分無約束和有約束兩種情況進(jìn)行分析。無約束的情況下我們采取萬能的梯度下降法來尋找最優(yōu)解,從傾斜度概念開始逐步引出曲面斜率,接著引申到導(dǎo)函數(shù)及梯度等概念,最終推導(dǎo)出為什么梯度下降法能往最優(yōu)解方向移動。從最簡單的一維到二維,再到三維以上的多維空間。在有約束的情況下我們通常采用拉格朗日函數(shù)來進(jìn)行求解,此外本書詳細(xì)講解了數(shù)學(xué)家是如何推導(dǎo)出拉格朗日函數(shù)的。
人工智能模型的輸入是一個向量,那么就涉及對現(xiàn)實世界的向量化。實際上我們能通過向量來抽象萬物,包括時序型數(shù)據(jù)、文本數(shù)據(jù)、圖片數(shù)據(jù)、聲音數(shù)據(jù)、視頻數(shù)據(jù)等。有了輸入后就需要機(jī)器學(xué)習(xí)算法來對接這些輸入,機(jī)器學(xué)習(xí)包括了監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三大類。監(jiān)督學(xué)習(xí)能夠?qū)崿F(xiàn)對事物的分類,包括常見的樸素貝葉斯、K近鄰、決策樹、邏輯回歸和支持向量機(jī)。此外監(jiān)督學(xué)習(xí)也能夠?qū)崿F(xiàn)對關(guān)系的捕捉,包括線性回歸、多項式回歸、支持向量回歸和決策樹回歸。無監(jiān)督學(xué)習(xí)則能實現(xiàn)聚類、降維、關(guān)聯(lián)規(guī)則、異常檢測等功能,無監(jiān)督學(xué)習(xí)就像是無師自通一樣。強(qiáng)化學(xué)習(xí)是通過與環(huán)境交互而不斷根據(jù)反饋信息作調(diào)整的一種學(xué)習(xí),就像是自己學(xué)會某個能力一樣。
然而,深度學(xué)習(xí)才是本輪大模型AI浪潮的推動者。深度學(xué)習(xí)充分向我們展示了“暴力美學(xué)”,真正做到了“大力出奇跡”的效果。深度學(xué)習(xí)其實就是多層的神經(jīng)網(wǎng)絡(luò),那么就要回歸到神經(jīng)網(wǎng)絡(luò)算法上。神經(jīng)網(wǎng)絡(luò)其實就是當(dāng)前最成功的大腦模擬方式,從最早的感知機(jī)模型發(fā)展到多層感知機(jī),在引入梯度下降后不斷擴(kuò)展成更深更寬的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),最終成就了深度學(xué)習(xí)。深度學(xué)習(xí)主要的網(wǎng)絡(luò)結(jié)構(gòu)包括卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和變換器神經(jīng)網(wǎng)絡(luò),其中卷積神經(jīng)網(wǎng)絡(luò)主要用于處理圖像,循環(huán)神經(jīng)網(wǎng)絡(luò)用于處理序列數(shù)據(jù),而變換器神經(jīng)網(wǎng)絡(luò)則是大模型的基礎(chǔ)。
人類語言異常復(fù)雜,機(jī)器學(xué)習(xí)為了處理人類語言而建立了自然語言處理學(xué)科分支。為了讓機(jī)器看見又建立了計算機(jī)視覺學(xué)科分支,實際就是對圖像進(jìn)行處理和識別,圖像就是一連串的像素。
再來看看大模型的絕對主角—ChatGPT。它是AI浪潮的引領(lǐng)者,后來又不斷冒出類似ChatGPT的對話模型,統(tǒng)稱為大語言模型。大語言模型具備獨有的涌現(xiàn)能力,它通過大的模型、大的參數(shù)和大的算力來實現(xiàn)一個能力超強(qiáng)的大語言模型能力。然而大道至簡,看似復(fù)雜的大語言模型卻是一個簡單的“單字接龍”游戲。當(dāng)然如果要從工程上實現(xiàn)大語言模型則要通過“預(yù)訓(xùn)練+微調(diào)”的方式,再加上人類反饋強(qiáng)化學(xué)習(xí),這些我們都在書中深入淺出地進(jìn)行了講解。除了大語言模型外,還有一類大模型能生成畫家級別的圖像,而這僅僅只需我們用言語描述清楚要生成的圖畫內(nèi)容即可。機(jī)器繪畫師的實現(xiàn)原理包括自動編碼器、變分自動編碼器、生成對抗網(wǎng)絡(luò)、擴(kuò)散模型、穩(wěn)定擴(kuò)散模型等。
只要緊跟書中的步伐就一定能參透大模型的奧秘。
1.1 生命的起源 2
1.2 人類智能的出現(xiàn) 3
1.3 人腦的結(jié)構(gòu) 5
第2章 人工智能學(xué)科 ◆9
2.1 何為智能 9
2.2 何為人工智能 10
2.3 弱/強(qiáng)人工智能 11
2.4 人工智能發(fā)展史 12
2.5 三大學(xué)派 20
第3章 圖靈機(jī)與計算機(jī) ◆23
3.1 圖靈機(jī) 24
3.2 計算機(jī) 30
第4章 現(xiàn)實世界的模型 ◆47
4.1 概念、理論與模型 47
4.2 數(shù)學(xué)模型理論 50
4.3 對現(xiàn)實世界建模 55
4.4 模型與算法 60
第5章 不確定世界的模型 ◆62
5.1 復(fù)雜的世界 62
5.2 不確定性是常態(tài) 63
5.3 以概率描述隨機(jī) 65
5.4 概率思維 67
5.5 貝葉斯定理 69
5.6 概率分布 72
第6章 如何尋找復(fù)雜模型的最優(yōu)解 ◆81
6.1 什么是最優(yōu)解 81
6.2 人工智能與最優(yōu)化 82
6.3 最優(yōu)化建模流程 84
6.4 模型三要素 85
6.5 無約束的最優(yōu)化 86
6.6 有約束的最優(yōu)化 98
第7章 向量與矩陣抽象萬物 ◆105
7.1 現(xiàn)實世界的數(shù)字化 105
7.2 空間與向量 109
7.3 向量抽象萬物 111
7.4 矩陣與張量 118
第8章 機(jī)器學(xué)習(xí) ◆120
8.1 機(jī)器學(xué)習(xí)是什么 120
8.2 機(jī)器學(xué)習(xí)與人工智能 121
8.3 機(jī)器學(xué)習(xí)的本質(zhì) 123
第9章 機(jī)器學(xué)習(xí)如何辨別事物 ◆135
9.1 二分類與多分類 135
9.2 分類的實現(xiàn)方式 136
9.3 機(jī)器學(xué)習(xí)分類算法 138
第10章 機(jī)器學(xué)習(xí)如何捕捉關(guān)系 ◆149
10.1 自然規(guī)律的發(fā)現(xiàn) 149
10.2 機(jī)器學(xué)習(xí)中的變量關(guān)系 151
10.3 回歸的原理 152
10.4 欠擬合與過擬合 156
10.5 常用的回歸算法 158
第11章 機(jī)器學(xué)習(xí)如何無師自通 ◆161
11.1 無監(jiān)督學(xué)習(xí) 161
11.2 無監(jiān)督學(xué)習(xí)類型 162
11.3 聚類 163
11.4 降維 167
11.5 關(guān)聯(lián)規(guī)則 168
11.6 異常檢測 171
11.7 監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí) 172
第12章 機(jī)器學(xué)習(xí)如何自己學(xué)會玩游戲 ◆173
12.1 人類與環(huán)境的交互 173
12.2 強(qiáng)化學(xué)習(xí) 174
12.3 馬爾可夫決策過程 177
12.4 Q學(xué)習(xí)訓(xùn)練過程 179
12.5 Q學(xué)習(xí)玩游戲例子 182
第13章 神經(jīng)網(wǎng)絡(luò)及其學(xué)習(xí)機(jī)制 ◆187
13.1 模擬大腦 188
13.2 感知機(jī)模型 189
13.3 引入梯度下降 191
13.4 多層感知機(jī) 193
13.5 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 194
13.6 激活函數(shù) 202
第14章 深度學(xué)習(xí)“大力出奇跡” ◆206
14.1 什么是深度學(xué)習(xí) 207
14.2 自動特征提取 208
14.3 卷積神經(jīng)網(wǎng)絡(luò) 209
14.4 循環(huán)神經(jīng)網(wǎng)絡(luò) 227
14.5 變換器神經(jīng)網(wǎng)絡(luò) 232
第15章 機(jī)器如何理解人類的語言 ◆245
15.1 人類語言復(fù)雜性 246
15.2 語言如何建模 247
15.3 詞向量 249
15.4 讓機(jī)器具有理解能力 253
15.5 自然語言處理 256
15.6 NLP為什么難 258
第16章 機(jī)器如何看見世界 ◆261
16.1 計算機(jī)視覺 261
16.2 一切皆像素 266
16.3 學(xué)習(xí)識別圖像 268
16.4 缺乏概念與知識 269
第17章 ChatGPT是如何工作的 271
17.1 ChatGPT介紹 271
17.2 大語言模型 273
17.3 語言模型的發(fā)展 275
17.4 大語言模型的使用 276
17.5 涌現(xiàn)能力 279
17.6 核心網(wǎng)絡(luò)架構(gòu) 280
17.7 大語言模型的“大” 282
17.8 海量語料庫 283
17.9 “單字接龍”游戲 284
17.10 預(yù)訓(xùn)練+微調(diào) 286
17.11 人類反饋強(qiáng)化學(xué)習(xí) 287
17.12 從GPT-1到GPT-4 290
第18章 如何讓機(jī)器成為繪畫師 ◆292
18.1 自動編碼器 293
18.2 變分自動編碼器 294
18.3 生成對抗網(wǎng)絡(luò) 297
18.4 擴(kuò)散模型 300
18.5 語言圖像關(guān)系模型 303
18.6 穩(wěn)定擴(kuò)散模型 307
- 零基礎(chǔ)玩轉(zhuǎn)國產(chǎn)大模型DeepSeek [徐永冰 張帥 編著]
- 網(wǎng)絡(luò)工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統(tǒng)項目管理師考試32小時通關(guān)(適用第4版考綱) [薛大龍]
- 信息系統(tǒng)管理工程師考試32小時通關(guān)(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測實訓(xùn) [洪曉江 達(dá)則曉麗 錢波]
- 科技信息檢索與論文寫作實用教程 [李振華]
- 傳統(tǒng)山水畫論解讀與實踐 [陳鈉 著]
- Python數(shù)據(jù)庫編程 [主編 殷樹友 邢 翀]
- 計算機(jī)基礎(chǔ)實訓(xùn)指導(dǎo) [主編 袁春萍 朱妮]
- 嵌入式人工智能技術(shù)應(yīng)用(數(shù)字教材) [主編 胡娜 楊國勇 晏廷榮]
- Vienna整流器技術(shù) [桂存兵 著]
- 變頻器與伺服應(yīng)用 [陳剛 葉云飛]
- 物聯(lián)網(wǎng)工程設(shè)計與實踐 [湯琳 李敏]
- 電商運(yùn)營與管理 [鐘肖英 陳瀟]
- Java面向?qū)ο蟪绦蛟O(shè)計 [主編 姜春磊 陳虹潔]
- 信息技術(shù)基礎(chǔ)(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應(yīng)用 [主編 陳 萍 劉培培 陳孟軍]
- 大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo) [主編 劉志堅]
- 高級辦公應(yīng)用項目教程 [主編 屈晶 趙成麗]
- 微信小程序開發(fā)項目實戰(zhàn)(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業(yè)檔案工作實戰(zhàn)寶典百問百答 [華俊 盧秀英 邵甜甜 著]
- 計算機(jī)網(wǎng)絡(luò)原理及應(yīng)用 [主編 唐繼勇 葉坤 孫夢娜]
- 大學(xué)生創(chuàng)業(yè)基礎(chǔ) [主編 王麗莉 王 楊]
- 船舶輔機(jī) [主編 王連海 于洋 姜淑翠]
- 大學(xué)生就業(yè)指導(dǎo) [主編 王麗莉 董宴廷]
- 系統(tǒng)架構(gòu)設(shè)計師章節(jié)習(xí)題與考點特訓(xùn) [主編 薛大龍 鄒月平]
- 高校學(xué)生工作探索與實踐 [郭亮 著]
- 大學(xué)生情商管理 [方雄 著]
- 2023年長沙市會展業(yè)發(fā)展報告 [主編 周棟良]
- 2023年長沙市金融業(yè)發(fā)展報告 [主編 任璐 王志輝]