第1章人工智能：一个世纪老故事（Artificial Intelligence: A Century-Old Story）

作者

Marly van Assen, MSc, PhD — Department of Radiology and Imaging Sciences, Emory University, Atlanta, GA. 同时也是本书共同编辑之一。
Emanuele Muscogiuri, MD — Department of Radiology and Imaging Sciences, Emory University；以及 Department of Radiology, Sapienza University of Rome, Italy.
Giovanni Tessarin, MD — Emory University；以及 Department of Radiology, University of Padua, Italy.
Carlo N. De Cecco, MD, PhD（通讯作者） — Division of Cardiothoracic Imaging, Emory University；本书主编之一。

本章的角色是全书的"开场历史综述"，不属于技术章节，而是为后续 54 章的方法学、临床应用章节做铺垫——告诉读者 AI 作为一个学科是如何走过 20 世纪的几次"寒冬-复兴"循环，并最终在 2010s 进入医学影像的爆发期。

内容概述

本章以"百年回顾"的视角，按时间顺序梳理 AI 从 1940s 的纯理论构想（McCulloch-Pitts 神经元、Turing 智能机器）到 2020s 的深度学习时代（AlexNet、COVID-19 早期预警）所经历的关键节点。核心论点可概括为三条：(1) AI 的发展并非线性，而是被两次"寒冬"（1970s 和 1990s）和两次"复兴"（1980s 专家系统 + 2010s 深度学习）所分割；(2) "symbolic AI vs connectionism"的范式之争贯穿始终，最终 connectionism（神经网络/深度学习）取得压倒性胜利；(3) 医学影像一直是 AI 应用的"前沿阵地"，从 1980s 的计算机辅助检测（CAD）系统，到 1990s 的 LeNet/CNN，再到 2010s 起的临床落地。读者只需要高中水平的数学和计算机知识即可理解本章，因为作者刻意避免公式、专注于叙事。理解本章对后续 Ch 2-9 的算法章节（CNN、深度学习、放射组学等）至关重要——这些章节讨论的所有概念（Perceptron、MLP、backprop、CNN）都在本章做了历史定位。

核心方程与概念

本章以历史叙事为主，没有正式的数学方程。但有若干必须理解的核心概念，它们是后续章节的基石：

1. McCulloch-Pitts 神经元（MCP, 1943）

形式：二元阈值逻辑单元，输入 $x_i$ 乘以权重 $w_i$，求和后与阈值 $\theta$ 比较，输出 0 或 1。
意义：受 Turing 早期工作启发，是第一个用逻辑演算描述生物神经元的数学模型。成为现代 ANN 设计的基石。
局限：MCP 不存储信息、不解释"学习"如何发生——它只回答"一个静态网络的输出是什么"，而不是"网络如何调整"。

2. Perceptron（Rosenblatt, 1957）及其"多层扩展"（MLP）

形式：在 MCP 基础上引入可学习权重 $w_i$，使用"成本函数"（cost function）来衡量预测与期望输出的差距，并据此调整权重，形式化"监督学习"的雏形。
形式化：$y = f\left(\sum_i w_i x_i + b\right)$，其中 $f$ 为激活函数（如阶跃函数、sigmoid）。
MLP：堆叠多个"层"——输入层、一个或多个隐藏层、输出层——形成"深度"网络。
意义：奠定了"通过梯度下降最小化成本函数"这一现代深度学习的核心范式。但 1969 年 Minsky & Papert 在《Perceptrons》一书中严格证明单层 Perceptron 连 XOR 这样的线性不可分问题都无法解决，导致学界 15 年内对神经网络失去兴趣。

3. Backpropagation（Rumelhart-Hinton-Williams, 1986）

形式：用链式法则（chain rule）将输出层的误差反向传播到隐藏层，依次计算每个权重的梯度 $\partial L / \partial w_i$，然后沿负梯度方向更新权重： $$w_i^{(t+1)} = w_i^{(t)} - \eta \frac{\partial L}{\partial w_i}$$ 其中 $\eta$ 为学习率，$L$ 为损失函数。
意义：第一次让多层神经网络"可训练"——这是深度学习在 1980s 萌芽的真正技术起点。
盲点：本章未提及 Paul Werbos 在 1970s 的"dynamic forward propagation"是同一思想的前身；这反映了主流叙事的简化。

4. 专家系统（Expert Systems, 1980s）

形式：将领域知识编码为"if-then 规则"（如 MYCIN 用约 500 条规则诊断细菌感染），通过推理机（inference engine）做出决策。
代表系统：DENDRAL（1965 化学）、MYCIN（1972 医学）、XCON（1980s 商业，DEC 公司用于 VAX 配置，5 年节省 1500 万美元）。
失败原因：知识获取瓶颈、缺乏常识、不能从经验学习、维护昂贵。

5. Convolutional Neural Network（CNN, LeCun et al., 1990s）

形式：用"卷积核"（convolutional filter）在空间局部滑动提取特征，下采样（pooling）降维，最终全连接层分类。
意义：把"图像的空间局部性"硬编码进网络结构，对图像任务极其高效。

6. AlexNet 与深度学习爆发（Krizhevsky-Sutskever-Hinton, 2012）

背景：2010 年 ImageNet 大规模视觉识别挑战赛（ILSVRC）启动；2012 年 AlexNet 用 GPU 训练 8 层 CNN，将 top-5 错误率从 26% 降至 15.3%。
2014 GoogLeNet / 2015 ResNet：错误率继续降至 6.67% 和 3.57%。

7. 两大"AI 寒冬"（AI Winters）

第一次寒冬（1970s-1980s 初）：Minsky & Papert 对 Perceptron 的批评 + 1973 年 Lighthill 报告质疑 AI 在英国 SRC 的投入回报 + DARPA 削减经费。
第二次寒冬（1990s）：专家系统的局限性 + backprop 在浅层网络中的局部极小值问题 + SVM 取代神经网络成为主流。
复兴催化剂：大数据的出现（互联网、影像存档）+ GPU 算力（CUDA 2007 后普及）。

8. 医学影像中的 CAD 系统（1980s 起）

代表研究：Fujita et al. 1992 用 MLP 在 SPECT 心肌灌注显像检测冠心病；Lin et al. 1993 用 ANN 减少胸部 X 线假阳性结节；Wu et al. 1995 用 CNN 区分良恶性乳腺微钙化。
关键负面证据：Fenton et al. 2007 年 NEJM 试验——4 年观察发现 CAD 辅助反而降低乳腺 X 线筛查的特异度（90.2% → 87.2%）和阳性预测值（4.1% → 3.2%）。
意义：揭示了"AI 算法的内部验证性能 ≠ 临床场景效用"——这一警示贯穿后续 50 多章。

9. AI 在 COVID-19 中的作用（2019-2020）

BlueDot 公司 2019 年 12 月 31 日预警 COVID 19，比 CDC 早约一周。
AI 用于药物重定位（drug repurposing）筛选 SARS-CoV-2 候选分子。

关键结论

AI 发展呈"指数 + 寒冬"双节律——两次寒冬（1970s, 1990s）均由"承诺与算力 / 数据不匹配"造成，而每次复兴都需要算力（Moore 定律、GPU）和数据（互联网、PACS）的同步成熟。
Turing 测试不是评估医学 AI 的合适标准——大多数医学 AI 不涉及自然语言，而是结构化的影像/数值输入。
CNN 是医学影像的"天然适配"——Fukushima 的 Neocognitron（1980）和 LeCun 的 LeNet（1990）早早为医学影像的 AI 化奠定了结构基础，远早于 2012 年的"深度学习革命"。
CAD 系统的早期失败是"AI 在医学的第一次大教训"——Fenton 2007 的 NEJM 试验警示：算法在回顾性数据上的高 AUC 并不自动转化为临床效益，必须做前瞻性、多中心、临床终点研究。
2012 AlexNet 之后，深度学习成为主流——从 ImageNet 错误率（26% → 3.57% 在 5 年内）可以看到一个不可逆的范式转移。
放射科医生不会被 AI 取代——本章最后引 Langlotz 2019（Radiol Artif Intell）的判断：AI 是"辅助工具"而非"替代者"，未来放射科住院医师培训需要专门增加 AI 课程。

挑战和开放性问题

"通用 AI" 何时到来？Minsky 1970 预测 3-8 年内出现"与普通人能力相当的机器"，至今 50+ 年仍未实现，过度承诺是 AI 史反复出现的现象。
Turing 测试的局限性：2014 Eugene Goostman 通过测试的争议、2018 Google Duplex 模仿理发师预约——这些"通过"是否真代表"智能"，仍是哲学与工程的交叉难题。
backprop 的生物学合理性：大脑是否真的用反向传播学习，仍未确定（Spiking Neural Networks、Hebbian Learning 等替代理论持续发展中）。
医学影像 AI 的"算法-临床落差"：从回顾性 AUC 到前瞻性临床终点，需要跨越数据分布偏移、标注者间差异、罕见病长尾等系统性问题。
"AI 寒冬"的循环是否已终结？部分观察者（Gary Marcus, Yann LeCun 等）认为 2020s 末可能再次出现"局部寒冬"——具体在大语言模型（LLM）过热、通用推理能力不足等方面。
医学 AI 的伦理与监管缺口：本章未展开（留到 Ch 49, 52），但 Fenton 2007 已显示"未经严格验证的临床部署"是真实风险。

个人反思与批判性分析

本章作为"全书的导论性历史综述"在结构上有明显的优势与简化：

优势： - 时间线完整、节点明确（图 1.1 是个很好的视觉摘要） - 把"symbolic AI vs connectionism"两条线的兴衰交代得很清楚 - 把医学影像中的 CAD、CNN 演进与主线叙事融合 - 引用充分（114 条参考文献），关键节点都标了原始文献

批判与补足： 1. 过度简化"backprop 发明"：本章只归功于 Rumelhart-Hinton-Williams 1986，但 Paul Werbos 1974 博士论文中的"dynamic feedback"、1960s 控制论的链式法则推导都已有雏形。这是 AI 史反复出现的"赢家叙事偏差"——Hinton 因 2018 图灵奖而被高估，其他独立贡献者被忽略。 2. 缺乏对"算力-数据-算法"三者耦合的系统分析：本章把 AlexNet 成功归于"GPU 算力 + 大数据"，但实际上 2010 年前后 GPU 通用计算（CUDA 2007, 2010 成熟）、大规模标注数据集（ImageNet 2009 发布）、ReLU/dropout 算法的同步成熟缺一不可。这是值得在 §2-5 章节中进一步展开的"组合创新"主题。 3. 对"寒冬"的政治经济学解释不足：第一次寒冬主要由英国 SRC 撤资、美国 DARPA 撤资的政治决定驱动；第二次寒冬由日本"第五代计算机"项目失败（1992）触发。本章把它们简化为"算法本身失败"——但实际上地缘政治与产业战略对 AI 兴衰的影响远大于纯技术评价。 4. Turing 测试的哲学讨论不够深：Weizenbaum 在 ELIZA 后对"AI 应当追求欺骗"提出深刻批评，但本章只用一段话提及，没有充分展开"AI 是否必须'理解'才能'有用'"这一核心问题——这恰是 Ch 52（伦理）应该接续讨论的。 5. "医学影像 AI 简史"过于美国中心：日本（Tokyo 大学、Kyoto 大学在医学影像 AI 早期有重要贡献）、欧洲（德国癌症研究中心、荷兰 Radboud 大学）的工作几乎被略过。一本由 Emory + Mayo + Utrecht 编辑的书应该有更平衡的地理代表性。 6. 从"历史"到"临床落地"的桥梁薄弱：第 1-9 章是历史 + 方法学，第 10 章起是临床应用。但医学影像 AI 临床落地的真实障碍（PACS 集成、医生工作流改变、保险报销、责任归属）在历史章节中完全没有提及——这是值得补的"实施科学"维度。

给作者的问题： - 在 2020 年这个时间点，你认为距离"AI 完全替代一名放射科医生的常规阅片"还有多少年？是 10 年还是 50 年？ - Fenton 2007 NEJM 的负面结果对 2010s 的深度学习 CAD 浪潮到底有多大影响？还是说大家刻意遗忘了这段历史？ - 1956 Dartmouth 会议如果没召开，AI 会延迟多少年出现？还是说"AI"作为一门学科终究会从其他领域（控制论、运筹学、统计学）独立出来？

值得复现的推导：MCP → Perceptron → MLP 的数学转换（Ch 2 会用现代符号重写），以及 backprop 的链式法则推导（建议结合 Ch 2 一起读）。

重要参考文献

[X1] Muthukrishnan N, et al. Brief history of artificial intelligence. Neuroimaging Clin N Am. 2020;30:393–9. DOI: 10.1016/j.nic.2020.07.001. [X2] Turing AM. On computable numbers, with an application to the entscheidungsproblem. London Mathematical Society. 1936;42:230–65. [X3] McCulloch WS, Pitts W. A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys. 1943;5:115–33. DOI: 10.1007/BF02478259. [X4] McCarthy J, Minsky ML, Rochester N, Shannon CE. A proposal for the Dartmouth summer research project on artificial intelligence. AI Mag. 2006;27(4):12–4. [X5] Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain. Psychol Rev. 1958;65(6):386–408. DOI: 10.1037/h0042519. [X6] Rumelhart DE, Hinton GE, Williams RJ. Learning representations by back-propagating errors. Nature. 1986;323(6088):533–6. DOI: 10.1038/323533a0. [X7] LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521(7553):436–44. DOI: 10.1038/nature14539. [X8] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks. Commun ACM. 2017;60(6):84–90. DOI: 10.1145/3065386. [X9] Fenton JJ, et al. Influence of computer-aided detection on performance of screening mammography. N Engl J Med. 2007;356(14):1399–409. DOI: 10.1056/NEJMoa066099. [X10] Langlotz CP. Will artificial intelligence replace radiologists? Radiol Artif Intell. 2019;1(3):e190058. DOI: 10.1148/ryai.2019190058. [X11] He K, Zhang X, Ren S, Sun J. Deep residual learning for image recognition. In: CVPR 2016. IEEE; 2016. p. 770–8. DOI: 10.1109/CVPR.2016.90. [X12] van Assen M, Lee SJ, De Cecco CN. Artificial intelligence from A to Z: from neural network to legal framework. Eur J Radiol. 2020;129:109083. DOI: 10.1016/j.ejrad.2020.109083.

第1章 人工智能：一个世纪老故事（Artificial Intelligence: A Century-Old Story）

作者