人工智能考试前整理的,很详细,虽然实际考试还是有好些想不起来,但总归起了一些作用的。
第1章绪论
人工智能的起源
现代人工智能的起源是1956年的达特茅斯会议。
参加者:麦卡锡、明斯基、香农、罗切斯特、纽厄尔、西蒙、萨缪尔、伯恩斯坦、摩尔、所罗门诺夫。
会议的主要成就就是让人工智能成了一个独立的研究学科。
定下来人工智能的英文名称是“Artificial Intelligence”
知识的定义、概念、基本单位
定义
柏拉图在《泰阿泰德篇》中给出知识的定义,即“被证实的、真的和被相信的陈述”,简称知识的JTB(Justified True Belief)条件。
然而,这个延续了两千多年的定义在1963年,被哲学家盖梯尔否定了。
概念
知识的基本单位就是概念。
概念的定义
- 概念的符号:即概念的名称,说明这个概念叫什么。
- 概念的内涵:即命题来表示,命题就是能判断真假的陈述句。
- 概念的外延:即经典集合来表示,用来说明与概念对应的事件对象是哪些。
概念的三个功能
指物功能:既指向客观世界的对象,表示客观世界的对象的可观测性,对象的客观的信仰,是指对相对于人或者仪器的知觉感知特性,依赖于人的主观感受。
指心功能:即指向人心智世界里的对象,代表心智世界里的对象表示。
指名功能:指向认知世界或者符号世界表示对象的符号名称,这些符号名称组成各种语言。
人工智能的三个流派
- 专注于实现AI指名功能的人工智能流派,称为符号主义。
- 专注于实现AI指心功能的人工智能流派,称为连接主义。
- 专注于实现AI指物功能的人工智能流派,称为行为主义。
概念的功能 | 人工智能的流派 | 观点 | 思想实验 | 挑战 |
---|---|---|---|---|
指名功能 | 符号主义 | 指名对了,指物自然正确 | 图灵测试、中文屋实验 | 完全实现指名功能也不见得有智能。概念的组合爆炸问题;概念的组合悖论问题;经典概念在现实中很难获得。知识很难获取 |
指物功能 | 连接主义 | 发现大脑的结构及处理信息的机制,揭示人工智能的本质机理,进而在机器上实现响应模拟 | 缸中之脑实验 | 指心没有问题,指物也存在问题。 |
指心功能 | 行为主义 | 只要实现指物功能,就认为具有智能了 | 完美伪装者和斯巴达人 | 外在表现与内心没有联系,无法测试 |
第2章概念表示
概念定义及三个组成部分
知识由概念组成,概念是构成人类知识世界的基本单元。
经典概念理论
一个经典概念由三部分组成
- 概念名
- 概念的内涵表示
- 概念的外延表示
概念名:偶数
内涵:能被2整除的自然数
外延:{0,2,5,8,...}
谓词符号化
两个奇数之和是奇数
令F(x):x是奇数。
∀x∀y (F(x)⋀F(y)→F(x+y))
任何人都会死,苏格拉底是人,因此,苏格拉底是会死的。
令F(x):x会死;M(x):x是人;a:苏格拉底。
(∀x(M(x)→F(x))⋀M(a))→F(a)
集合表示
一个由概念指称的所有对象组成的整体称为该概念的集合,这些概念是集合中的元素或成员。该概念名为集合的名称,该集合称为对应概念的外延表示,集合中的元素为对应概念的指称对象。
三种新概念理论
原型理论
一个概念可以由一个原型表示。一个原型可以是一个实际的或虚拟的对象样例,也可以是一个假设性的图示性表征。
模糊集合、模糊逻辑。
样例理论
概念不可以由一个对象样例或原型来代表,但可以由许多个已知样例来表示。
概念的样例三种不同形式:
- 由该概念的所有已知样例来表示
- 由该概念的已知最佳、最经典或最常见样例来表示
- 由该概念的经过选择的部分样例来表示
知识理论
概念是特定知识框架(文明)的一个组成部分。
概念在人的心智中的表示称为认知表示,属于概念的内涵表示。
第3章知识表示
知识的特性
相对正确性
所有知识都是在一定条件及环境下产生的,在这种条件及环境下才是正确的。
不确定性
存在真与假的中间状态。
- 随机性引起的不确定性(连环计)
- 模糊性引起的不确定性(张三跑得快)
- 经验引起的不确定性(老马识途)
- 不完全性引起的不确定性(火星)
可表示性与可利用性
知识可以用适当形式表示出来,如用语言、文字、图形、神经网络等。
知识可以被用来解决问题。
了解常用的知识表示方法
知识表示:将人类认知形式化或模型化。
- 产生式表示法
- 框架表示法
- 状态空间表示法
掌握产生式表示法
确定性规则知识的产生式表示
IF 动物会飞 AND 会下蛋 THEN 该动物是鸟
IF P THEN Q
P→Q
蕴含是产生式的一种特例
不确定性知识的产生式表示
IF 发烧 THEN 感冒 (0.6)
IF P THEN Q (置信度)
P→Q (置信度)
置信度如果等于1就称为确定性知识
确定性事实性知识的产生式表示
老李年龄是40岁 (Li,age,40)
老李和老王是朋友 (friend,Li,Wang)
(对象,属性,值)
(关系,对象1,对象2)
不确定性事实产生式表示
老李年龄很可能是40岁 (Li,age,40,0.8)
老李和老王不大可能是朋友 (friend,Li,Wang,0.1)
(对象,属性,值,置信度)
(关系,对象1,对象2,置信度)
产生式与蕴含的区别
产生式除蕴含外,还包括各种操作、规则、算子、函数等。蕴含是产生式的特例。
蕴含只能表示精确的知识,产生式可以表示不精确的知识。
BNF
::=
表示定义为,|
表示或者是,[]
表示可缺省。
<产生式>::=<前提> <结论>
<前提>::=<简单条件>|<复合条件>
<结论>::=<事实>|<操作>
<复合条件>::=<简单条件>AND<简单条件>[AND<简单条件>...]|<简单条件>OR<简单条件>[OR<简单条件>...]
<操作>::=<操作名>[(<变元>,...)]
规则
匹配成功,调整顺序,找出常用规则。
初始事物存在综合数据库。
不断匹配,添加匹配成功的知识,直到成功匹配。
- 效率较低
- 不能表达结构性信息
- 领域间关系密切,不存在结构性知识
- 经验性知识,没有严格统一标准
- 领域问题的求解过程可表示为一系列相对独立操作,每个操作可表示为一条或多条产生式规则。
掌握框架表示法
框架:描述所论对象属性的一种数据结构
一个框架分为若干个槽,一个槽分为若干个侧面
一个槽用于描述对象某一方面的属性
一个侧面用于描述相应属性的一个方面
槽与侧面具有的属性值称为槽值和侧面值
<框架名> 槽名1: 侧面名11,侧面名12
槽名2:侧面名21,侧面名22
约束:约束条件1,约束条件2
框架可作为另一框架子框架
- 结构性好
- 继承性好
第4章知识图谱
掌握并会描述知识图谱的四个阶段
- 知识建模 知识表示、本体建模 定义领域知识描述的概念、事件、规则及相互关系的知识表示方法,建立知识图谱的概念模型
- 知识获取 知识学习、语义集成 对知识建模定义知识要素进行实例化
- 知识管理 知识存储和索引
- 知识赋能 语义搜索、知识问答、大数据语义分析
掌握命题的谓词表示及语义网络表示
【PPT、请教】
第5章搜索算法
掌握4种搜索算法并会根据问题给出状态转移图
无信息引导的搜索策略(盲目搜索):不考虑给定问题的特有知识,系统根据实现确定的某种固定排序,依次调用规则或随机调用规则 有信息引导的搜索策略(启发式搜索):考虑问题领域可应用知识,
深度优先搜索
扩展、回溯、深度限制 如果深度限制过深,则影响求解效率;反之如果限制过浅,则可能导致找不到解。 死循环问题解决:记录从初始节点到当前节点的路径,每扩展一个节点,就要检测该节点是否出现在这条路径上;如果发现出现在该路径上,则强制回溯,探索其他深度最深的节点。
广度优先搜索
问题有解,一定能比DFS先找到最优解。 占用比较大的搜索空间。
A算法
为尽快找到耗散值较小的路径,希望选择节点尽可能处于最佳路径。 节点处于最佳路径可能性评价函数: f(n)=g(n)+h(n)
- g(n) 初始节点s到节点n的最佳路径耗散值的估计值。
- h(n) 从节点n到目标点t的最佳路径耗散值的估计值,称为启发函数
- f(n) 初始节点s经节点n到达目标节点t最佳路径耗散值的估计值,称为评价函数 OPEN:已经被生成但未被扩展的节点 CLOSE:已经被生成并且被扩展的节点 每次从OPEN表中取f最小的节点进行扩展。
博弈搜索
选择、扩展、模拟、回传。
掌握启发式函数的定义及含义,并会给出启发式函数
【课后第2题】
A*条件:h(n)<=h*(n)
单调条件:h(ni)-h(nj)<=C(ni,nj)且h(t)=0
第6章群智能算法
掌握遗传算法的计算流程
5个基本要素
- 参数编码 二进制编码/实数编码 每个参数二进制编码得到子串,连在一起形成染色体
- 初始种群设定 太小性能不好,太大计算复杂
- 适应度函数的设计
- 遗传操作的设计
- 线性排序
- 最佳个体保存
- 一点交叉
- 二点交叉
- 一点变异
- 逆转变异
- 插入变异
- 控制参数的设定
比较高效进行概率意义的搜索
掌握蚁群算法公式中参数的含义
信息素和局部启发信息共同决定下一步。
- α越大,蚂蚁倾向于选择其他蚂蚁走过路径
- α=0,多重起点的随机贪婪算法
- β=0,正反馈启发算法
各路径信息素消散规则
蚁群信息素浓度更新规则
掌握粒子群算法公式中参数的含义
- Ω 惯性权重因子 非负 全局寻优 部分寻优
- 1 个体学习因子
- 2 社会学习因子
- Vmax 最大速度 每维变化的20%~30%
只有第1部分:一直以当前速度飞行
没有第1部分:速度只取决于当前位置和历史最好位置
没有第2部分:有能力到达新的搜索空间,复杂问题容易陷入局部最优
没有第3部分:得到最优解概率非常小
第7章机器学习
掌握监督学习、无监督学习、弱监督学习的定义及所属经典算法
监督学习
给定数据集学习出一个函数,训练集中的目标是人类标注的。
垃圾邮件过滤
- K临近算法
- 决策树
- 朴素贝叶斯
- Logistic回归
- 支持向量机
- AdaBoost
无监督学习
学习中只提供事物的基本特征,不提供事物的名称,让学习者自己总结归纳。
分类:事先确定有哪些类别,每个类别有标签
聚类:数据没有标签,按照一定算法将相似数据聚集到一起。
掌握KNN算法
- 计算待预测样本与训练集合所有样本距离
- 取k个最相似样本,统计坐标
- 占比最高的类标赋予待预测样本
掌握决策树算法并会画决策树
【决策树】
掌握支持向量机的定义,了解求解过程
【?】
找出超平面,二分类
核函数
掌握K-means算法
- 初始化k个聚类中心
- 为每个个体分配聚类中心
- 移动聚类中心
- 重复迭代,直到聚类中心不变或变化很小
了解强化学习的定义及内涵
把学习看作试探评价过程。Agent选择一个动作作用于环境,环境接收该动作后状态发生变化,产生一个强化信号反馈给Agent,Agent根据强化信号和环境所处状态选择下一个动作。
- 根据先验得到初始认知(值函数)
- 根据认知选择动作(伴随一定的随机性)
- 获得经验
- 根据反馈,修改认知
- 根据延迟的反馈,回退修改历史认知
第8章人工神经网络与深度学习
掌握神经网络并会画全连接的神经网络图
- 前馈型:各神经元接受前一层的输入并传给下一层,没有反馈
- 反馈型:存在一些神经元的输出经过若干个神经元后反馈到这些神经元的输入端
了解神经网络中的参数及意义
加权求和、线性动态系统、非线性函数映射。
sigmod(z)=1/(1+exp{-z})
relu(u)=z(z>0)或relu(z)=0(z<=0)
会计算卷积
如何通俗易懂地解释卷积? - 马同学的回答 - 知乎 https://www.zhihu.com/question/22298352/answer/228543288
掌握生成对抗网络中的两个主要部件及其功能
生成器的输入是一个来自常见概率分布的随机噪声矢量,输出是计算机生成的伪数据。
判别器的输入是图片,可能采用真实数据,也可能采用生成数据,输出是一个标量用于代表真实图片的概率。
第9章专家系统
掌握专家系统的定义
一种智能的计算机程序,它运用知识和推理来解决只有专家才能解决的复杂问题。
知识库:存储求解领域问题需要的知识。一般以规则表示。
推理机:一个执行结构,对知识库中的知识进行解析,利用知识进行推理。
- 人机交互界面
- 知识获取模块
- 动态数据库
- 解释器 专家系统特有的模块,与一般计算机软件系统的区别之一
- why解释
- how解释
正向推理:正向运用规则,由已知条件向目标出发运用推理。
逆向推理:逆向运用规则,假设目标解成立,逆向进行推理。
掌握非确定性推理并会计算
IF A THEN B CF(B,A)
CF(A∧B) = min(CF(A), CF(B))
CF(A∨B) = max(CF(A), CF(B))
第10章计算机视觉
掌握基于浅层模型的方法的处理流程
- 图像预处理过程p
- 目标对齐
- 几何归一化
- 特征设计与提取过程q
- 全局特征 图像全部像素或多个区域含有的信息建模
- 局部特征 只从一个局部区域内的少量像素中提取信息
- 特征汇聚或变换h
- 分类器或回归器函数g的设计与训练
掌握后三个步骤中涉及的主要技术
局部二值模式
词袋模型
主成分分析
线性判别分析
核方法
流形学习
第11章自然语言处理
人工智能的分类和处理技术
- 运算智能 记忆和计算
- 感知智能 感知环境的能力,如听觉、视觉、触觉等
- 认知智能 语言理解,知识和推理
- 创造智能 对未见过、未发生过的事物和问题,运用经验,通过想象力设计实验、验证并予以发现的智能过程
自然语言处理是从自然语言到机器内部的一个映射。
自然语言处理是认知智能的核心 |
---|
引导知识图谱进步 |
提高用户理解能力 |
推动推理能力 |
了解自然语言处理中的主要技术和应用场景
【NLP技术.km】
掌握自然语言人机交互,包括人机对话及聊天机器人的设计
- 对话理解
- 领域分类:根据用户对话内容确定所属领域
- 用户意图分类:根据领域分类结果确定用户意图
- 槽位填充:针对某个具体任务,抽取槽位信息
- 对话管理
- 对话状态跟踪
- 对话策略优化
- 基于有限状态机的方法
- 基于部分可观测马尔科夫链的方法
- 基于深度学习的方法
- 回复生成
- 基于模板的方法
- 基于统计的方法
基于规则的聊天机器人
- 规则系统对输入的自然语言进行解析
- 抽取预定义的关键词
- 通过预先定义的模板进行回复
- 如果不在规则体系内,则采用万能回复
基于检索的聊天机器人
- 搜索引擎技术+人类对话语料
- 组织成一问一答结构
- 匹配模型是关键
序列-编码器->向量-编码器->序列
第12章语音处理
掌握声音的四要素
- 音高 声波频率
- 音强 振幅大小
- 音长 持续时间长短
- 音色 声音的特色和本质
掌握声音识别常用的几种声学特征
- 梅尔频率倒谱系数
- 梅尔标度滤波器组特征
- 感知线性预测倒谱系数
了解语音识别中常见的难题
- 语音信号复杂多样
- 语音信号只有少量信息与语音识别相关
掌握语音识别系统的框架,并掌握部分功能
特征提取、声学模型、语言模型、解码搜索 【PPT第26页】
了解语音增强中的几种关键技术
- 回声消除
- 混响抑制
- 语音降噪
了解情感语音的描述方式
离散情感模型,将情感描述为离散的形容词、标签的形式,如高兴,愤怒等
维度情感模型将情感状态描述为多维情感空间中的连续数值,也称作连续情感描述。
第13章规划
掌握经典规划的假设条件以及经典规划的定义
- 有限系统 问题只涉及有限的状态、行动、事件等
- 完全可观察 永远知道系统当前所在的状态
- 确定性 每个行动只会导致一种确定的影响
- 静态性 不存在外部行动,环境所有的改变都来自控制者的行动
- 状态目标 目标是一些需要达到的目标状态
- 序列规则 规则结果是一个线性行动序列
- 隐含时间 不考虑时间连续性
- 离线规划 规划求解器不考虑执行时状态
满足上述所有假设的称为经典规划。
掌握运用经典规划理论描述和解决实际问题的方法
这个问题可以定义3个行动:Load(装载), Unload(卸载)和Fly(飞行)。行动作用于两个谓词:In(c,p)表示货物c在飞机p内,At(x,a)表示物体x(飞机或货物)在机场a。
注意当货物在飞机内(In)时,它不在(At)任何地方,所以At的实际意思是“可供在一个给定的地方使用”
Action(Load(c,p,a))
前提:At(c,a) ∧ At(p,a) ∧ Cargo(c) ∧ Plane(p) ∧ Airport(a)
正效果:In(c,p)
负效果: At(c,a)
Action(Unload(c,p,a))
前提:In(c,p) ∧ At(p,a) ∧ Cargo(c) ∧ Plane(p) ∧ Airport(a)
正反馈:At(c,a)
负反馈:In(c,p)
Action(Fly(p,from,to))
前提:At(p,from) ∧ Plane(p) ∧ Airport(from) ∧ Airport(to)
正反馈:At(p,to)
负反馈: At(p,from)
第14章多智能体
掌握多智能体的定义
智能体是一个软件实体,可以代表一个人类用户或其他程序。智能体具有一个行为集合,且具有某种程度的独立性或者自主性。智能体在采取行动时,通常采用知识来表示用户的目标或期望。
掌握多智能体的四种性质和强性质
- 自主性
- 主动性
- 反应能力
- 社会能力
强性质
- 移动性 具备在网络上移动的能力
- 诚实性 互相通信时不会传输错误的信息
- 无私性 不会有冲突的目标
- 理性 具备一定的理性,能分析目标是否能实现
掌握智能体的抽象结构
- 无内部状态
- 有内部状态 【……】
最后修改于 2019-01-03