用于构建最可能的元组的廉价AI算法
问题描述:
我正在寻找一种算法来给出元组的第一个元素的最可能的2元组。用于构建最可能的元组的廉价AI算法
最有可能的是当两个元素以前在一批中更经常见到的时候。
比方说,你有批次的无限流:
BATCH 1:
border
color
border-radius
dispaly
BATCH 2:
width
height
left
top
color
border
BATCH 3:
border
border-radius
width
height
BATCH 4:
[ and so on ... ]
批次连续流中,并永远不会结束。该算法必须训练能够知道批次中哪两个元素最有可能一起出现。
例如,当新批次进来时,我问算法“请将批次拆分成一组2元组,以便它们可能在一批中”。
比方说批次编号4来自于如下
BATCH 4:
border
width
border-radius
height
该算法将批料分成两个2-元组,如下所示:
[border, border-radius]
[width, height]
因为这些元素历史更可能一起进入一个批次。
该算法不一定是确切的,但相当便宜和操作概率。
答
它被称为频繁2项目集。
但是对于元组的限制,它简直归结为计数。
这仅仅是一个例子,或者这与实际数据的大小有些相似吗?或者更清楚:平均/最大批量?不同元素的数量?旧批次是否与新批次不相关? – sascha
你研究并考虑了哪些算法?什么是您的特定应用程序的权衡?有很多关于N-gram的文献,N = 2是一个(相对)简单的介绍示例。 – Prune
查看[关联规则挖掘]中的频繁项目集(https://en.wikipedia.org/wiki/Association_rule_learning)。在wiki页面上描述的算法(Apriori,FP growth,..)可能就是您正在寻找的。 – SND