用于构建最可能的元组的廉价AI算法

问题描述:

我正在寻找一种算法来给出元组的第一个元素的最可能的2元组。用于构建最可能的元组的廉价AI算法

最有可能的是当两个元素以前在一批中更经常见到的时候。

比方说,你有批次的无限流:

BATCH 1: 

border 
color 
border-radius 
dispaly 


BATCH 2: 

width 
height 
left 
top 
color 
border 


BATCH 3: 

border 
border-radius 
width 
height 


BATCH 4: 

[ and so on ... ] 

批次连续流中,并永远不会结束。该算法必须训练能够知道批次中哪两个元素最有可能一起出现。

例如,当新批次进来时,我问算法“请将批次拆分成一组2元组,以便它们可能在一批中”。

比方说批次编号4来自于如下

BATCH 4: 

border 
width 
border-radius 
height 

该算法将批料分成两个2-元组,如下所示:

[border, border-radius] 
[width, height] 

因为这些元素历史更可能一起进入一个批次。

该算法不一定是确切的,但相当便宜和操作概率。

+0

这仅仅是一个例子,或者这与实际数据的大小有些相似吗?或者更清楚:平均/最大批量?不同元素的数量?旧批次是否与新批次不相关? – sascha

+0

你研究并考虑了哪些算法?什么是您的特定应用程序的权衡?有很多关于N-gram的文献,N = 2是一个(相对)简单的介绍示例。 – Prune

+1

查看[关联规则挖掘]中的频繁项目集(https://en.wikipedia.org/wiki/Association_rule_learning)。在wiki页面上描述的算法(Apriori,FP growth,..)可能就是您正在寻找的。 – SND

它被称为频繁2项目集。

但是对于元组的限制,它简直归结为计数。