用于构建最可能的元组的廉价AI算法

问题描述：

我正在寻找一种算法来给出元组的第一个元素的最可能的2元组。用于构建最可能的元组的廉价AI算法

最有可能的是当两个元素以前在一批中更经常见到的时候。

比方说，你有批次的无限流：

BATCH 1: 

border 
color 
border-radius 
dispaly 


BATCH 2: 

width 
height 
left 
top 
color 
border 


BATCH 3: 

border 
border-radius 
width 
height 


BATCH 4: 

[ and so on ... ]

批次连续流中，并永远不会结束。该算法必须训练能够知道批次中哪两个元素最有可能一起出现。

例如，当新批次进来时，我问算法“请将批次拆分成一组2元组，以便它们可能在一批中”。

比方说批次编号4来自于如下

BATCH 4: 

border 
width 
border-radius 
height

该算法将批料分成两个2-元组，如下所示：

[border, border-radius] 
[width, height]

因为这些元素历史更可能一起进入一个批次。

该算法不一定是确切的，但相当便宜和操作概率。

这仅仅是一个例子，或者这与实际数据的大小有些相似吗？或者更清楚：平均/最大批量？不同元素的数量？旧批次是否与新批次不相关？ – sascha

你研究并考虑了哪些算法？什么是您的特定应用程序的权衡？有很多关于N-gram的文献，N = 2是一个（相对）简单的介绍示例。 – Prune

查看[关联规则挖掘]中的频繁项目集（https://en.wikipedia.org/wiki/Association_rule_learning）。在wiki页面上描述的算法（Apriori，FP growth，..）可能就是您正在寻找的。 – SND

答

它被称为频繁2项目集。

但是对于元组的限制，它简直归结为计数。

用于构建最可能的元组的廉价AI算法

相关推荐