跳转至

第1章 人工智能:一个世纪老故事(Artificial Intelligence: A Century-Old Story)

作者

  • Marly van Assen, MSc, PhD — Department of Radiology and Imaging Sciences, Emory University, Atlanta, GA. 同时也是本书共同编辑之一。
  • Emanuele Muscogiuri, MD — Department of Radiology and Imaging Sciences, Emory University;以及 Department of Radiology, Sapienza University of Rome, Italy.
  • Giovanni Tessarin, MD — Emory University;以及 Department of Radiology, University of Padua, Italy.
  • Carlo N. De Cecco, MD, PhD(通讯作者) — Division of Cardiothoracic Imaging, Emory University;本书主编之一。

本章的角色是全书的"开场历史综述",不属于技术章节,而是为后续 54 章的方法学、临床应用章节做铺垫——告诉读者 AI 作为一个学科是如何走过 20 世纪的几次"寒冬-复兴"循环,并最终在 2010s 进入医学影像的爆发期。

内容概述

本章以"百年回顾"的视角,按时间顺序梳理 AI 从 1940s 的纯理论构想(McCulloch-Pitts 神经元、Turing 智能机器)到 2020s 的深度学习时代(AlexNet、COVID-19 早期预警)所经历的关键节点。核心论点可概括为三条:(1) AI 的发展并非线性,而是被两次"寒冬"(1970s 和 1990s)和两次"复兴"(1980s 专家系统 + 2010s 深度学习)所分割;(2) "symbolic AI vs connectionism"的范式之争贯穿始终,最终 connectionism(神经网络/深度学习)取得压倒性胜利;(3) 医学影像一直是 AI 应用的"前沿阵地",从 1980s 的计算机辅助检测(CAD)系统,到 1990s 的 LeNet/CNN,再到 2010s 起的临床落地。读者只需要高中水平的数学和计算机知识即可理解本章,因为作者刻意避免公式、专注于叙事。理解本章对后续 Ch 2-9 的算法章节(CNN、深度学习、放射组学等)至关重要——这些章节讨论的所有概念(Perceptron、MLP、backprop、CNN)都在本章做了历史定位。

核心方程与概念

本章以历史叙事为主,没有正式的数学方程。但有若干必须理解的核心概念,它们是后续章节的基石:

1. McCulloch-Pitts 神经元(MCP, 1943)

  • 形式:二元阈值逻辑单元,输入 \(x_i\) 乘以权重 \(w_i\),求和后与阈值 \(\theta\) 比较,输出 0 或 1。
  • 意义:受 Turing 早期工作启发,是第一个用逻辑演算描述生物神经元的数学模型。成为现代 ANN 设计的基石。
  • 局限:MCP 不存储信息、不解释"学习"如何发生——它只回答"一个静态网络的输出是什么",而不是"网络如何调整"。

2. Perceptron(Rosenblatt, 1957)及其"多层扩展"(MLP)

  • 形式:在 MCP 基础上引入可学习权重 \(w_i\),使用"成本函数"(cost function)来衡量预测与期望输出的差距,并据此调整权重,形式化"监督学习"的雏形。
  • 形式化\(y = f\left(\sum_i w_i x_i + b\right)\),其中 \(f\) 为激活函数(如阶跃函数、sigmoid)。
  • MLP:堆叠多个"层"——输入层、一个或多个隐藏层、输出层——形成"深度"网络。
  • 意义:奠定了"通过梯度下降最小化成本函数"这一现代深度学习的核心范式。但 1969 年 Minsky & Papert 在《Perceptrons》一书中严格证明单层 Perceptron 连 XOR 这样的线性不可分问题都无法解决,导致学界 15 年内对神经网络失去兴趣。

3. Backpropagation(Rumelhart-Hinton-Williams, 1986)

  • 形式:用链式法则(chain rule)将输出层的误差反向传播到隐藏层,依次计算每个权重的梯度 \(\partial L / \partial w_i\),然后沿负梯度方向更新权重: $\(w_i^{(t+1)} = w_i^{(t)} - \eta \frac{\partial L}{\partial w_i}\)$ 其中 \(\eta\) 为学习率,\(L\) 为损失函数。
  • 意义:第一次让多层神经网络"可训练"——这是深度学习在 1980s 萌芽的真正技术起点。
  • 盲点:本章未提及 Paul Werbos 在 1970s 的"dynamic forward propagation"是同一思想的前身;这反映了主流叙事的简化。

4. 专家系统(Expert Systems, 1980s)

  • 形式:将领域知识编码为"if-then 规则"(如 MYCIN 用约 500 条规则诊断细菌感染),通过推理机(inference engine)做出决策。
  • 代表系统:DENDRAL(1965 化学)、MYCIN(1972 医学)、XCON(1980s 商业,DEC 公司用于 VAX 配置,5 年节省 1500 万美元)。
  • 失败原因:知识获取瓶颈、缺乏常识、不能从经验学习、维护昂贵。

5. Convolutional Neural Network(CNN, LeCun et al., 1990s)

  • 形式:用"卷积核"(convolutional filter)在空间局部滑动提取特征,下采样(pooling)降维,最终全连接层分类。
  • 意义:把"图像的空间局部性"硬编码进网络结构,对图像任务极其高效。

6. AlexNet 与深度学习爆发(Krizhevsky-Sutskever-Hinton, 2012)

  • 背景:2010 年 ImageNet 大规模视觉识别挑战赛(ILSVRC)启动;2012 年 AlexNet 用 GPU 训练 8 层 CNN,将 top-5 错误率从 26% 降至 15.3%。
  • 2014 GoogLeNet / 2015 ResNet:错误率继续降至 6.67% 和 3.57%。

7. 两大"AI 寒冬"(AI Winters)

  • 第一次寒冬(1970s-1980s 初):Minsky & Papert 对 Perceptron 的批评 + 1973 年 Lighthill 报告质疑 AI 在英国 SRC 的投入回报 + DARPA 削减经费。
  • 第二次寒冬(1990s):专家系统的局限性 + backprop 在浅层网络中的局部极小值问题 + SVM 取代神经网络成为主流。
  • 复兴催化剂:大数据的出现(互联网、影像存档)+ GPU 算力(CUDA 2007 后普及)。

8. 医学影像中的 CAD 系统(1980s 起)

  • 代表研究:Fujita et al. 1992 用 MLP 在 SPECT 心肌灌注显像检测冠心病;Lin et al. 1993 用 ANN 减少胸部 X 线假阳性结节;Wu et al. 1995 用 CNN 区分良恶性乳腺微钙化。
  • 关键负面证据:Fenton et al. 2007 年 NEJM 试验——4 年观察发现 CAD 辅助反而降低乳腺 X 线筛查的特异度(90.2% → 87.2%)和阳性预测值(4.1% → 3.2%)。
  • 意义:揭示了"AI 算法的内部验证性能 ≠ 临床场景效用"——这一警示贯穿后续 50 多章。

9. AI 在 COVID-19 中的作用(2019-2020)

  • BlueDot 公司 2019 年 12 月 31 日预警 COVID 19,比 CDC 早约一周。
  • AI 用于药物重定位(drug repurposing)筛选 SARS-CoV-2 候选分子。

关键结论

  • AI 发展呈"指数 + 寒冬"双节律——两次寒冬(1970s, 1990s)均由"承诺与算力 / 数据不匹配"造成,而每次复兴都需要算力(Moore 定律、GPU)和数据(互联网、PACS)的同步成熟。
  • Turing 测试不是评估医学 AI 的合适标准——大多数医学 AI 不涉及自然语言,而是结构化的影像/数值输入。
  • CNN 是医学影像的"天然适配"——Fukushima 的 Neocognitron(1980)和 LeCun 的 LeNet(1990)早早为医学影像的 AI 化奠定了结构基础,远早于 2012 年的"深度学习革命"。
  • CAD 系统的早期失败是"AI 在医学的第一次大教训"——Fenton 2007 的 NEJM 试验警示:算法在回顾性数据上的高 AUC 并不自动转化为临床效益,必须做前瞻性、多中心、临床终点研究
  • 2012 AlexNet 之后,深度学习成为主流——从 ImageNet 错误率(26% → 3.57% 在 5 年内)可以看到一个不可逆的范式转移。
  • 放射科医生不会被 AI 取代——本章最后引 Langlotz 2019(Radiol Artif Intell)的判断:AI 是"辅助工具"而非"替代者",未来放射科住院医师培训需要专门增加 AI 课程。

挑战和开放性问题

  • "通用 AI" 何时到来?Minsky 1970 预测 3-8 年内出现"与普通人能力相当的机器",至今 50+ 年仍未实现,过度承诺是 AI 史反复出现的现象。
  • Turing 测试的局限性:2014 Eugene Goostman 通过测试的争议、2018 Google Duplex 模仿理发师预约——这些"通过"是否真代表"智能",仍是哲学与工程的交叉难题。
  • backprop 的生物学合理性:大脑是否真的用反向传播学习,仍未确定(Spiking Neural Networks、Hebbian Learning 等替代理论持续发展中)。
  • 医学影像 AI 的"算法-临床落差":从回顾性 AUC 到前瞻性临床终点,需要跨越数据分布偏移、标注者间差异、罕见病长尾等系统性问题。
  • "AI 寒冬"的循环是否已终结?部分观察者(Gary Marcus, Yann LeCun 等)认为 2020s 末可能再次出现"局部寒冬"——具体在大语言模型(LLM)过热、通用推理能力不足等方面。
  • 医学 AI 的伦理与监管缺口:本章未展开(留到 Ch 49, 52),但 Fenton 2007 已显示"未经严格验证的临床部署"是真实风险。

个人反思与批判性分析

本章作为"全书的导论性历史综述"在结构上有明显的优势与简化

优势: - 时间线完整、节点明确(图 1.1 是个很好的视觉摘要) - 把"symbolic AI vs connectionism"两条线的兴衰交代得很清楚 - 把医学影像中的 CAD、CNN 演进与主线叙事融合 - 引用充分(114 条参考文献),关键节点都标了原始文献

批判与补足: 1. 过度简化"backprop 发明":本章只归功于 Rumelhart-Hinton-Williams 1986,但 Paul Werbos 1974 博士论文中的"dynamic feedback"、1960s 控制论的链式法则推导都已有雏形。这是 AI 史反复出现的"赢家叙事偏差"——Hinton 因 2018 图灵奖而被高估,其他独立贡献者被忽略。 2. 缺乏对"算力-数据-算法"三者耦合的系统分析:本章把 AlexNet 成功归于"GPU 算力 + 大数据",但实际上 2010 年前后 GPU 通用计算(CUDA 2007, 2010 成熟)、大规模标注数据集(ImageNet 2009 发布)、ReLU/dropout 算法的同步成熟缺一不可。这是值得在 §2-5 章节中进一步展开的"组合创新"主题。 3. 对"寒冬"的政治经济学解释不足:第一次寒冬主要由英国 SRC 撤资、美国 DARPA 撤资的政治决定驱动;第二次寒冬由日本"第五代计算机"项目失败(1992)触发。本章把它们简化为"算法本身失败"——但实际上地缘政治与产业战略对 AI 兴衰的影响远大于纯技术评价。 4. Turing 测试的哲学讨论不够深:Weizenbaum 在 ELIZA 后对"AI 应当追求欺骗"提出深刻批评,但本章只用一段话提及,没有充分展开"AI 是否必须'理解'才能'有用'"这一核心问题——这恰是 Ch 52(伦理)应该接续讨论的。 5. "医学影像 AI 简史"过于美国中心:日本(Tokyo 大学、Kyoto 大学在医学影像 AI 早期有重要贡献)、欧洲(德国癌症研究中心、荷兰 Radboud 大学)的工作几乎被略过。一本由 Emory + Mayo + Utrecht 编辑的书应该有更平衡的地理代表性。 6. 从"历史"到"临床落地"的桥梁薄弱:第 1-9 章是历史 + 方法学,第 10 章起是临床应用。但医学影像 AI 临床落地的真实障碍(PACS 集成、医生工作流改变、保险报销、责任归属)在历史章节中完全没有提及——这是值得补的"实施科学"维度。

给作者的问题: - 在 2020 年这个时间点,你认为距离"AI 完全替代一名放射科医生的常规阅片"还有多少年?是 10 年还是 50 年? - Fenton 2007 NEJM 的负面结果对 2010s 的深度学习 CAD 浪潮到底有多大影响?还是说大家刻意遗忘了这段历史? - 1956 Dartmouth 会议如果召开,AI 会延迟多少年出现?还是说"AI"作为一门学科终究会从其他领域(控制论、运筹学、统计学)独立出来?

值得复现的推导:MCP → Perceptron → MLP 的数学转换(Ch 2 会用现代符号重写),以及 backprop 的链式法则推导(建议结合 Ch 2 一起读)。

重要参考文献

[X1] Muthukrishnan N, et al. Brief history of artificial intelligence. Neuroimaging Clin N Am. 2020;30:393–9. DOI: 10.1016/j.nic.2020.07.001. [X2] Turing AM. On computable numbers, with an application to the entscheidungsproblem. London Mathematical Society. 1936;42:230–65. [X3] McCulloch WS, Pitts W. A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys. 1943;5:115–33. DOI: 10.1007/BF02478259. [X4] McCarthy J, Minsky ML, Rochester N, Shannon CE. A proposal for the Dartmouth summer research project on artificial intelligence. AI Mag. 2006;27(4):12–4. [X5] Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain. Psychol Rev. 1958;65(6):386–408. DOI: 10.1037/h0042519. [X6] Rumelhart DE, Hinton GE, Williams RJ. Learning representations by back-propagating errors. Nature. 1986;323(6088):533–6. DOI: 10.1038/323533a0. [X7] LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521(7553):436–44. DOI: 10.1038/nature14539. [X8] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks. Commun ACM. 2017;60(6):84–90. DOI: 10.1145/3065386. [X9] Fenton JJ, et al. Influence of computer-aided detection on performance of screening mammography. N Engl J Med. 2007;356(14):1399–409. DOI: 10.1056/NEJMoa066099. [X10] Langlotz CP. Will artificial intelligence replace radiologists? Radiol Artif Intell. 2019;1(3):e190058. DOI: 10.1148/ryai.2019190058. [X11] He K, Zhang X, Ren S, Sun J. Deep residual learning for image recognition. In: CVPR 2016. IEEE; 2016. p. 770–8. DOI: 10.1109/CVPR.2016.90. [X12] van Assen M, Lee SJ, De Cecco CN. Artificial intelligence from A to Z: from neural network to legal framework. Eur J Radiol. 2020;129:109083. DOI: 10.1016/j.ejrad.2020.109083.