一个国家由 n
个编号为 0
到 n - 1
的城市组成。在这个国家里,每两个 城市之间都有一条道路连接。
总共有 m
个编号为 0
到 m - 1
的朋友想在这个国家旅游。他们每一个人的路径都会包含一些城市。每条路径都由一个整数数组表示,每个整数数组表示一个朋友按顺序访问过的城市序列。同一个城市在一条路径中可能 重复 出现,但同一个城市在一条路径中不会连续出现。
给你一个整数 n
和二维数组 paths
,其中 paths[i]
是一个整数数组,表示第 i
个朋友走过的路径,请你返回 每一个 朋友都走过的 最长公共子路径 的长度,如果不存在公共子路径,请你返回 0
。
一个 子路径 指的是一条路径中连续的城市序列。
示例 1:
输入:n = 5, paths = [[0,1,2,3,4], [2,3,4], [4,0,1,2,3]] 输出:2 解释:最长公共子路径为 [2,3] 。
示例 2:
输入:n = 3, paths = [[0],[1],[2]] 输出:0 解释:三条路径没有公共子路径。
示例 3:
输入:n = 5, paths = [[0,1,2,3,4], [4,3,2,1,0]] 输出:1 解释:最长公共子路径为 [0],[1],[2],[3] 和 [4] 。它们长度都为 1 。
提示:
1 <= n <= 105
m == paths.length
2 <= m <= 105
sum(paths[i].length) <= 105
0 <= paths[i][j] < n
paths[i]
中同一个城市不会连续重复出现。
方法一:字符串哈希
字符串哈希是把一个任意长度的字符串映射成一个非负整数,并且其冲突的概率几乎为 0。字符串哈希用于计算字符串哈希值,快速判断两个字符串是否相等。
取一固定值 BASE,把字符串看作是 BASE 进制数,并分配一个大于 0 的数值,代表每种字符。一般来说,我们分配的数值都远小于 BASE。例如,对于小写字母构成的字符串,可以令 a=1, b=2, ..., z=26。取一固定值 MOD,求出该 BASE 进制对 M 的余数,作为该字符串的 hash 值。
一般来说,取 BASE=131 或者 BASE=13331,此时 hash 值产生的冲突概率极低。只要两个字符串 hash 值相同,我们就认为两个字符串是相等的。通常 MOD 取 2^64,C++ 里,可以直接使用 unsigned long long 类型存储这个 hash 值,在计算时不处理算术溢出问题,产生溢出时相当于自动对 2^64 取模,这样可以避免低效取模运算。
除了在极特殊构造的数据上,上述 hash 算法很难产生冲突,一般情况下上述 hash 算法完全可以出现在题目的标准答案中。我们还可以多取一些恰当的 BASE 和 MOD 的值(例如大质数),多进行几组 hash 运算,当结果都相同时才认为原字符串相等,就更加难以构造出使这个 hash 产生错误的数据。
class Solution:
def longestCommonSubpath(self, n: int, paths: List[List[int]]) -> int:
def get(l, r, h):
return (h[r] - h[l - 1] * p[r - l + 1]) % mod
def check(l):
cnt = Counter()
for k, path in enumerate(paths):
vis = set()
for i in range(len(path) - l + 1):
j = i + l - 1
x = get(i + 1, j + 1, hh[k])
if x not in vis:
vis.add(x)
cnt[x] += 1
return max(cnt.values()) == len(paths)
base = 133331
mod = 2**64 + 1
p = [0] * 100010
p[0] = 1
for i in range(1, len(p)):
p[i] = (p[i - 1] * base) % mod
hh = []
for path in paths:
h = [0] * (len(path) + 10)
for j, c in enumerate(path):
h[j + 1] = (h[j] * base) % mod + c
hh.append(h)
left, right = 0, min(len(path) for path in paths)
while left < right:
mid = (left + right + 1) >> 1
if check(mid):
left = mid
else:
right = mid - 1
return left
class Solution {
int N = 100010;
long[] h = new long[N];
long[] p = new long[N];
private int[][] paths;
Map<Long, Integer> cnt = new HashMap<>();
Map<Long, Integer> inner = new HashMap<>();
public int longestCommonSubpath(int n, int[][] paths) {
int left = 0, right = N;
for (int[] path : paths) {
right = Math.min(right, path.length);
}
this.paths = paths;
while (left < right) {
int mid = (left + right + 1) >> 1;
if (check(mid)) {
left = mid;
} else {
right = mid - 1;
}
}
return left;
}
private boolean check(int mid) {
cnt.clear();
inner.clear();
p[0] = 1;
for (int j = 0; j < paths.length; ++j) {
int n = paths[j].length;
for (int i = 1; i <= n; ++i) {
p[i] = p[i - 1] * 133331;
h[i] = h[i - 1] * 133331 + paths[j][i - 1];
}
for (int i = mid; i <= n; ++i) {
long val = get(i - mid + 1, i);
if (!inner.containsKey(val) || inner.get(val) != j) {
inner.put(val, j);
cnt.put(val, cnt.getOrDefault(val, 0) + 1);
}
}
}
int max = 0;
for (int val : cnt.values()) {
max = Math.max(max, val);
}
return max == paths.length;
}
private long get(int l, int r) {
return h[r] - h[l - 1] * p[r - l + 1];
}
}