我正在寻找一种快速算法来确定给定二维数组的特定最小属性 - 没有共同行或列的最小值的总和。我确定这一定有一个名字,但我不知道它叫什么。

我有一个字符串匹配系统,它将在空格上拆分输入字符串并将其与搜索值语料库进行比较(也在空格中拆分),并返回每个字符串中标记之间的距离矩阵,我想减少通过采用不重复使用任何输入/输出标记组合的最小距离组合,将其转换为单个聚合距离。

例子:

{ 1, 2 }   => 5 (either 1+4, or 3+2)
{ 3, 4 }

{ 0, 2 }   => 6 (because 2+4 < 0+8)
{ 4, 8 }

{ 1, 0, 0 }
{ 0, 1, 0 } => 0
{ 0, 0, 1 }

{ 2, 3, 4 }
{ 3, 2, 4 } => 6 (2+2+2)
{ 4, 3, 2 }

到目前为止我一直在使用的朴素算法看起来像这样(C#):
public static int Minimux(this int[,] array) {
  var xUsed = new bool[array.GetLength(0)];
  var yUsed = new bool[array.GetLength(1)];
  var xMax = array.GetLength(0);
  var yMax = array.GetLength(1);
  var minima = new List<int>();
  var limit = Math.Min(xMax, yMax);
  int xMin = 0, yMin = 0;
  while (minima.Count < limit) {
    var vMin = Int32.MaxValue;
    for (var x = 0; x < xMax; x++) {
      for (var y = 0; y < yMax; y++) {
        if (xUsed[x] || yUsed[y] || array[x, y] >= vMin) continue;
        vMin = array[x, y];
        xMin = x;
        yMin = y;
      }
    }
    xUsed[xMin] = true;
    yUsed[yMin] = true;
    minima.Add(vMin);
  }
  return (minima.Sum());
}

它基本上进行数组扫描,当它找到每个最小值时,它将行/列组合标记为“已使用”,因此不会再次考虑它 - 一旦列表中的最小值与最短的元素一样多数组维度,它返回这些最小值的总和。

问题是它在以下情况下会崩溃:
{ 0, 0, 0 }
{ 0, 0, 0 } => 3 (when it should be returning 1)
{ 1, 2, 3 }

当扫描到达最后一行时,它已经将第 0 列和第 1 列标记为“已使用”,因此第 2 行中的最小未使用值是 3,而实际上它应该使用 1
是否存在执行此操作的标准算法?

最佳答案

是的,有一个标准算法可以解决这个问题。它的名字是 Hungarian algorithm

关于algorithm - 是否存在找到二维数组中非相交值的最小总和的算法?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15364078/

10-14 11:17