日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)

上下文无关语法:

依存句法结构:通过找到句子中每个词所依赖的结构来描述句子结构

Catalan数:

完整的语言学以树库的形式标注数据,

依存树

短语结构语法

依存句法的思想是:一个句子模型,我们有一个词法项之间的关系或者词之间的关系,只有词法项之间是二元的不对称关系

泛依存(universal dependencies)

依存距离

投影依存树:如果一个依存树是完全嵌套的,则被称为投影依存树,可以把它投射到一个平面上,然后得到一个嵌套关系。

正确外位:

依存分析的方法

动态编程法

图算法:MST算法(最小生成树算法)

确定型依存句法分析

基于转换的依存分析方法

基于弧标准转换的依存分析

root堆,任意句子开始分析时都放在这个堆栈上,堆栈的顶端在右面,

缓冲:就是要处理的句子,缓冲的左端为顶部,因为要拿掉无用的词,所以它们的顶部就是它们的交界点

三种操作:shift、left-arc、right-arc

shift:取缓冲区顶部词,然后把它放到堆栈顶部,然后在shift一次,再取缓冲顶部的词挪到堆顶部,

对堆而言,最右是顶部,
对缓冲而言,最左是顶部

left-arc、right-arc:通过在左侧或右侧添加词作为独立项来做出附加判断

left-arc:规定堆中的第二个顶部元素是堆的顶部元素的独立项,left-arc取走此独立项(I 是 ate 的独立项)

right-arc:规定堆的顶部元素是堆的第二顶部元素的一个独立项,right-arc取走此顶部项(fish 是顶部项),并增加一个弧

最终想要达到的状态:堆里只有一个root,缓冲为空

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)

竖线表示附加元素到列表的操作

依存分析的评估

准确性测量

UAS方法:仅看箭头忽略标签,未标记准确率
LAS:使用标签,并且规定只有当标签正确时你的结果才是正确的。标记性准确分数

No Search模型

第七讲 tensorflow入门

节点类型:

变量将成为输出其当前值得有状态节点,所有节点都是操作

占位符是那些在执行时间才会接收值的节点

数学操作节点:

代码:

用变量和占位符建立一个图

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
把图部署到会话(session),即执行环境上

tf.initialize_all_variable:将之前调用的所有变量初始化

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
训练模型

定义损失:
使用占位符来表示标签,作为我们在执行时喂给的数据,
日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
计算梯度:

先创建一个优化器对象,

tensorflow计算梯度的工作方式是:
每一个图节点都有一个附加的梯度操作,都有相对于输入预先构建的输出梯度,所以,当我们在计算我们的交叉熵相对于所有的参数的梯度时,通过图使用链式法则和利用反向传播计算是非常简单的

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
迭代学习:

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)

线性回归:

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)

Word2vec

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
59行多了一个小括号
60、61行少了一个小括号

日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)