日常防忘:CS224n 第六讲(依存分析)第七讲(tensorflow入门)
上下文无关语法:
依存句法结构:通过找到句子中每个词所依赖的结构来描述句子结构
Catalan数:
完整的语言学以树库的形式标注数据,
依存树
短语结构语法
依存句法的思想是:一个句子模型,我们有一个词法项之间的关系或者词之间的关系,只有词法项之间是二元的不对称关系
泛依存(universal dependencies)
依存距离
投影依存树:如果一个依存树是完全嵌套的,则被称为投影依存树,可以把它投射到一个平面上,然后得到一个嵌套关系。
正确外位:
依存分析的方法
动态编程法
图算法:MST算法(最小生成树算法)
确定型依存句法分析
基于转换的依存分析方法
基于弧标准转换的依存分析
root堆,任意句子开始分析时都放在这个堆栈上,堆栈的顶端在右面,
缓冲:就是要处理的句子,缓冲的左端为顶部,因为要拿掉无用的词,所以它们的顶部就是它们的交界点
三种操作:shift、left-arc、right-arc
shift:取缓冲区顶部词,然后把它放到堆栈顶部,然后在shift一次,再取缓冲顶部的词挪到堆顶部,
对堆而言,最右是顶部,
对缓冲而言,最左是顶部
left-arc、right-arc:通过在左侧或右侧添加词作为独立项来做出附加判断
left-arc:规定堆中的第二个顶部元素是堆的顶部元素的独立项,left-arc取走此独立项(I 是 ate 的独立项)
right-arc:规定堆的顶部元素是堆的第二顶部元素的一个独立项,right-arc取走此顶部项(fish 是顶部项),并增加一个弧
最终想要达到的状态:堆里只有一个root,缓冲为空
竖线表示附加元素到列表的操作
依存分析的评估
准确性测量
UAS方法:仅看箭头忽略标签,未标记准确率
LAS:使用标签,并且规定只有当标签正确时你的结果才是正确的。标记性准确分数
No Search模型
第七讲 tensorflow入门
节点类型:
变量将成为输出其当前值得有状态节点,所有节点都是操作
占位符是那些在执行时间才会接收值的节点
数学操作节点:
代码:
用变量和占位符建立一个图
把图部署到会话(session),即执行环境上
tf.initialize_all_variable:将之前调用的所有变量初始化
训练模型
定义损失:
使用占位符来表示标签,作为我们在执行时喂给的数据,
计算梯度:
先创建一个优化器对象,
tensorflow计算梯度的工作方式是:
每一个图节点都有一个附加的梯度操作,都有相对于输入预先构建的输出梯度,所以,当我们在计算我们的交叉熵相对于所有的参数的梯度时,通过图使用链式法则和利用反向传播计算是非常简单的
迭代学习:
线性回归:
Word2vec
59行多了一个小括号
60、61行少了一个小括号