C++笔试之基础08求两个字符串的最长公共子串,最长公共子序列,编辑距离
(1) 找出两个字符串的最长公共子串
题目:输入两个字符串,找出两个字符串中最长的公共子串。
找两个字符串的最长公共子串,这个子串要求在原字符串中是连续的。因此我们采用一个二维矩阵来存储中间结果,下面我们看这个二维数组如何构造?
假设两个字符串分别是:”bab”和”caba”。
如果str[i] == str[j] 则matrix[i][j] = 1,否则matrix[i][j] = 0
然后我们从矩阵中找出斜对角线最长的那个子字符串,就是最长公共子串。
即”ab”和”ba”分别为2。
我们可以简化一下,在当我们计算matrix[i][j]时,我们判断str[i] == str[j] 和matrix[i-1][j-1]。
如果str[i] == str[j],则matrix[i][j] = matrix[i-1][j-1] + 1;否则matrix[i][j] = 0。
如下图所示:
所以此时,我们只是将matrix[M][N]中,找到最大的值,即为最长公共子串。
然后我们还可以简化一下空间复杂度。
因为我们每判断一个matrix[i][j]时,实际上它只与matrix[i-1][j-1]相关。故所以我们可以使用一维数组来保存上一次的结果。
实现代码如下:
[cpp] view plain copy
1.#include <cstring>
2.爱迪生资料简介#include <iostream>
3.using namespace std;
4.
5.int GetLongestCommonSubString(const char *pStr1, const char *pStr2)
6.{
7./* 判断参数合法性 */
8.if (pStr1 == NULL || pStr2 == NULL)
9.{
10.return -1;
11.}
12.
13.int n = strlen(pStr1);
14.int m = strlen(pStr2);
15.int longestCommonSubString = 0;
16.
17./* 申请辅助空间,并初始化为0 */
18.int *LCS = new int[m];
19.for (int i = 0; i < m; i++)
20.{
21.LCS[i] = 0;
22.}
23.
24./* 不断判断pStr[i] ?= pStr[j],然后根据不同情况来更新LCS */
25.for (int i = 0; i < n; i++)
26.{
27.for (int j = m - 1; j >= 0; j--)
28.{
29.if (pStr1[i] == pStr2[j]) /* 如果pStr1[i] == pStr2[j],LCS[j] = LCS[j-1] + 1 */
30.{
31.if (j == 0)
32.{
33.LCS[j] = 1;
34.红烧白菜}
35.el
36.{
37.LCS[j] = LCS[j-1] + 1;
38.}
39.}
40.el /* 如果pStr1[i] != pStr2[j],LCS[j] = 0 */
41.{
42.LCS[j] = 0;
43.}
44.
奴仆45./* 更新最长子串的长度 */
如何设置彩铃
46.if (LCS[j] > longestCommonSubString)
47.{
48.longestCommonSubString = LCS[j];
49.}
50.}
51.}
52.
53.delete LCS;
54.LCS = NULL;
55.
56.return longestCommonSubString;
57.}
58.
59.void Test(const char *testName, const char *pStr1, const char *pStr2, int expectedLongestCommonSubString)
60.{
61.cout << testName << " : ";
62.if (GetLongestCommonSubString(pStr1, pStr2) == expectedLongestCommonSubString)
63.{
64.电脑网速cout << "Pasd." << endl;
65.}
66.el
67.{
68.食开头的成语cout << "Failed." << endl;
69.}
简化分批法70.}
71.
72.int main()
73.{
74.初中必备古诗文Test("Test1", "caba", "bab", 2);
75.Test("Test2", "abcd", "efg", 0);
76.Test("Test3", "abcde", "abcde", 5);
77.}
(2) 找出两个字符串的最长公共子序列
题目:输入两个字符串,求两个字符串的最长公共子序列。
首先,最长公共子序列与最长公共子串不同,子序列不要求其在原字符串是连续的。例如字符串X={A,B,C,B,D,A,B},Y = {B,D,C,A,B,A},则X与Y的最长公共子序列为Z={B,C,B,A}。
我们假设X={x1, x2, x3, …, xm},则X的前缀,Xi = {x1, x2, … ,xi}。即X={A,B,C,B,D,A,B},X4={A,B,C,B}。
Y = {y1, y2, y3, … ,yn},则Z={z1, z2, …,zk} 是X和Y的最长公共子序列。
如果xm == yn, 则zk = xm =yn 并且 Zk-1 是Xm-1 和 Yn-1的最长公共子序列。
如果 xm != yn, 则zk != xm,并且Z是Xm-1和Yn的最长公共子序列。
如果 xm != yn, 则zk != yn,并且Z是xm 和Yn-1的最长公共子序列。
所以我们定义了C[i][j]二维数组,用来存储Xi和Yj的最长公共子序列。
0 如果i==0或者j==0
即C[i][j] = c[i-1][j-1] + 1 如果i,j > 0并且 xi == yj