位运算

位运算符

'&'(与)，有0则0
'|'(或)，有1则1
'^'(异或) ，相同为0，不同为1———–位运算中常用
'~'(按位取反) ，有1为0，有0为1
'<<' (左移)，先求该数的补码，再向左移动右边的位数，空位补0，最高位丢弃，最后将移动后的二进制数转为十进制数
'>>' (右移)，先求该数的补码，再向右移动右边的位数，最高位为0，空位补0，最高位是1，空位补1，最后将移动后的二进制数转为十进制数
'>>>'(无符号右移)，先求该数的补码，再向右移动右边的位数，空位补0，最高位丢弃，最后将移动后的二进制数转为十进制数

原码(-100)：1110 0100
      反码：1001 1011(符号位不变，其他位取反)
      补码：1001 1100(反码+1，1为二进制的)
原码(9)：0000 1001--------------->正数的原、反、补码是一样的
   反码：0000 1001
   补码：0000 1001
    
左移：将-100左移三位是：-32
          |1 0 0 1  1 1 0 0|
       1 |0 0 1 1  1 0 0 0|------->左移一位 
    1 0 |0 1 1 1  0 0 0 0|------->左移一位 
  1 0 0|1 1 1 0  0 0 0 0|------->左移一位            
       |左移三位后的数的补码
    补码：1 1 1 0  0 0 0 0(被左移的数为负数)
    反码：1 1 0 1  1 1 1 1---------------->补码求原码，给补码-1 
    原码：1 0 1 0  0 0 0 0------->左移三位的数为-32
    
右移：将-100右移三位是：
             |1 0 0 1  1 1 0 0|
          1 |1 0 0  1 1 1 0|0------------->右移一位
       1 1 |1 0  0 1 1 1|0 0------------->右移一位
    1 1 1 |1  0 0 1 1|1 0 0------------>右移一位 
      右移三位的数     |----->再求它的反码---原码就是要求的数
          | 原数的补码  |
    
无符号右移：将-100右移三位是：    
             |1 0 0 1  1 1 0 0|
           0|1 0 0  1 1 1 0|0------------->右移一位
        0 0|1 0  0 1 1 1|0 0------------->右移一位
     0 0 0|1  0 0 1 1|1 0 0------------>右移一位 
      右移三位的数     |----->再求它的反码---原码就是要求的数
          | 原数的补码      |

左移，右移的求法(针对于正数)：

左移<<:给原数乘以2的移动次数幂 100<<3 是 100*2^3=800

右移>>:给原数除以2的移动次数幂 100>>3 是 100/2^3=12

leetcode题精选

[169] 多数元素

给定一个大小为 n 的数组，找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。

你可以假设数组是非空的，并且给定的数组总是存在多数元素。

示例 1:

输入: [3,2,3]

输出: 3

示例 2:

输入: [2,2,1,1,1,2,2]

输出: 2

这道题使用了Moore Voting算法，即摩尔投票算法求众数，对于求众数的问题复杂度降到了惊人的时间O(n)，空间O(1)。

算法思想是：设定一个候选者，每出现相同的元素计数器+1，否则-1。当计数器为0时，说明当前元素与候选者出现次数相同，更换候选者为当前元素。遍历完数组时当前的候选者即为所求众数。

var majorityElement = function(nums) {
  let res = nums[0];
  let count = 0;
  for (let i = 0; i < nums.length; i++) {
    if (count === 0) {
      res = nums[i];
      count++;
    } else {
      res === nums[i] ? count++ : count--;
    }
  }
  return res;
};

[136] 只出现一次的数字

给定一个非空整数数组，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。

说明：你的算法应该具有线性时间复杂度。你可以不使用额外空间来实现吗？

根据题目，我们很直观的想出：可以利用hash表的方式存储第一次得到的值，之后每次查询hash表看是否有相同的值，若有则删除。遍历结束后hash表中剩下的值即为所求。

这样做时间复杂度O(n)，空间复杂度O(n)。

var singleNumber = function(nums) {
  const hash = {};
  for (let i = 0; i < nums.length; i++) {
    if (hash[nums[i]] === undefined) {
      hash[nums[i]] = nums[i];
    } else {
      Reflect.deleteProperty(hash, nums[i]);
    }
  }
  return hash[Reflect.ownKeys(hash)[0]];
};

当然也可以利用排序后的数组相邻的值若不同则可得唯一性来解，这样的时间复杂度O(nlgn)，空间复杂度O(1)。这里就不多说了。

但由于题目要求时间复杂度O(n)，空间复杂度O(1)，因此不能使用排序算法，也不能使用hash-table。

本题使用二进制异或的性质来完成：两个数字异或 a^b 是将 a 和 b 的二进制每一位进行运算，如果同一位的数字相同则为0，不同则为1。

var singleNumber = function(nums) {
  let res = 0;
  for (let i = 0; i < nums.length; i++) {
    res = res ^ nums[i];
  }
  return res;
};

[187] 重复的DNA序列

DNA序列由一系列核苷酸组成，缩写为 ‘A’, ‘C’, ‘G’ 和 ‘T’.。

例如，”ACGAATTCCG” 是一个 DNA序列。
在研究 DNA 时，识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列的字符串 s ，返回所有在 DNA 分子中出现不止一次的长度为 10 的序列(子字符串)。你可以按任意顺序返回答案。

示例 1：

输入：s = “AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT”
输出：[“AAAAACCCCC”,”CCCCCAAAAA”]
示例 2：

输入：s = “AAAAAAAAAAAAA”
输出：[“AAAAAAAAAA”]

子区间—-一下联想到滑动窗口和哈希表的方法

方法一：哈希表

我们可以用一个哈希表统计 s 所有长度为 10 的子串的出现次数，返回所有出现次数超过 10的子串。
代码实现时，可以一边遍历子串一边记录答案，为了不重复记录答案，我们只统计当前出现次数为 2的子串。

function findRepeatedDnaSequences(s: string): string[] {
	const res = [];
    const map = new Map();
	for(let i = 0; i <= s.length-10; i++) {
        const sub = s.slice(i,i+10);
        map.set(sub,(map.get(sub)||0)+1)  //次数加一，没有设为1

        if(map.get(sub)===2){
            res.push(sub);
        }
    } 
    return res;
};

复杂度分析

时间复杂度：O(NL)，其中 N 是字符串s 的长度，L=10 即目标子串的长度。

空间复杂度：O(NL)。

方法二：哈希表 + 滑动窗口 + 位运算

由于s中只含有4种字符，我们可以将每个字符用2个比特表示，即：

A 表示为二进制00；
C 表示为二进制01；
G 表示为二进制10；
T 表示为二进制11。

如此一来，一个长为 10 的字符串就可以用 20 个比特表示，而一个 int 整数有 32 个比特，足够容纳该字符串，因此我们可以将 s 的每个长为 10 的子串用一个int整数表示。

注意到上述字符串到整数的映射是一一映射，每个整数都对应着一个唯一的字符串，因此我们可以将方法一中的哈希表改为存储每个长为 10 的子串的整数表示。

如果我们对每个长为 10 的子串都单独计算其整数表示，那么时间复杂度仍然和方法一一样为 O(NL)。为了优化时间复杂度，我们可以用一个大小固定为 10 的滑动窗口来计算子串的整数表示。设当前滑动窗口对应的整数表示为 x，当我们要计算下一个子串时，就将滑动窗口向右移动一位，此时会有一个新的字符进入窗口，以及窗口最左边的字符离开窗口，这些操作对应的位运算，按计算顺序表示如下：

滑动窗口向右移动一位：x = x << 2，由于每个字符用 2 个比特表示，所以要左移 2 位；
一个新的字符ch 进入窗口：x = x | bin[ch]，这里 bin[ch] 为字符 ch 的对应二进制；
窗口最左边的字符离开窗口：x = x & ((1 << 20) - 1)，由于我们只考虑 x 的低 20 位比特，需要将其余位置零，即与上 (1 << 20) - 1。

将这三步合并，就可以用 O(1) 的时间计算出下一个子串的整数表示，即 x = ((x << 2) | bin[ch]) & ((1 << 20) - 1)。

function findRepeatedDnaSequences(s: string): string[] {
	
    const L = 10;
    const bin = new Map();
    bin.set('A', 0);
    bin.set('C', 1);
    bin.set('G', 2);
    bin.set('T', 3);
    
    const ans = [];
    const n = s.length;
    if (n <= L) {
        return ans;
    }
    let x = 0;
    for (let i = 0; i < L - 1; ++i) {
        x = (x << 2) | bin.get(s[i]);
    }
    const cnt = new Map();
    for (let i = 0; i <= n - L; ++i) {
        x = ((x << 2) | bin.get(s[i + L - 1])) & ((1 << (L * 2)) - 1);
        cnt.set(x, (cnt.get(x) || 0) + 1);
        if (cnt.get(x) === 2) {
            ans.push(s.slice(i, i + L));
        }
    }
    return ans;


};

[1371] 每个元音包含偶数次的最长子字符串

给你一个字符串 s ，请你返回满足以下条件的最长子字符串的长度：每个元音字母，即 ‘a’，’e’，’i’，’o’，’u’ ，在子字符串中都恰好出现了偶数次。

示例 1：

输入：s = “eleetminicoworoep”
输出：13
解释：最长子字符串是 “leetminicowor” ，它包含 e，i，o 各 2 个，以及 0 个 a，u 。
示例 2：

输入：s = “leetcodeisgreat”
输出：5
解释：最长子字符串是 “leetc” ，其中包含 2 个 e 。
示例 3：

输入：s = “bcbcbc”
输出：6
解释：这个示例中，字符串 “bcbcbc” 本身就是最长的，因为所有的元音 a，e，i，o，u 都出现了 0 次。

提示：

1 <= s.length <= 5 x 10^5
s 只包含小写英文字母。

因为出现字母 ——-考虑使用前缀和位运算加哈希表来算

引入前缀和：将双变量转为单变量

[0,j]的元音次数 – [0，i-1]对应发元音次数 = 偶数；
求[0,x]的元音次数，变量就只有1个了

我们只关心【差值】是否是偶数，不关心偶数到底是多少

偶数 – 奇数 = 奇数；奇偶性相同时均为奇数；
可等价于：
[0,j]出现的元音次数的奇偶，相同于，[0,i-1]对应的原因次数的奇偶
【特别注意】出现0次（没有出现），也是出现了偶次

奇偶是相对的状态

两个相反的状态，可以抽象为 —— 用 0 代表偶数，1 代表奇数
[0,x] 的五个元音各自出现次数的奇偶性用 0/1 表示，组成一个5位二进制数。比如 00001 代表 u o i e 都出现偶次（0 次也是偶次），a 出现奇次
管这叫[0,x] 区间的 state，记录区间中元音出现次数的奇偶信息

题目再次等价转化

[ 0, j ] 的 state 等于[ 0, i – 1] 的 state，即两个二进制数相等。找出满足该条件且 j – i 最大的 i、j 组合，因为两个前缀区间相距越远，所形成的子串越长。
遍历字符串，求出 [0,x] 的 state，看看哪些 state 相同，找出离得最远的

怎么求前缀区间的 state

比方说 [0:1] 的 state 是 00110 ，出现 e 和 i 奇数次，假如下一字符是 i，则 [0,2] 区间出现 i 的次数变为偶数，state 为 00010
二进制数的第三位从 1 翻转为 0，其他位不变
使特定位置翻转正是异或的作用，第三位翻转，就是异或了 00100
其实异或相当于不带二进制的加法，所以有00110^00100 = 00010
u o i e a 分别有对应的二进制数：10000、01000、00100、00010、00001
当前前缀区间的 state = 前一个前缀区间 state ^ 当前字符对应的二进制数

预置 -1 的情况，使通式普遍适用

[ i, j ] 的 u o i e a 出现偶次 <=> [0, j ] 的 state 等于 [0, i – 1] 的 state
i 显然可以为 0 ，则 i-1 为 -1 ，我们让 [0,-1] 的 state 为 00000，表示在字符串 -1 的位置，所有元音都出现偶次（0次）
预置了一种不存在的情况，看似荒谬，其实只是为了让边界情况也能套用通式

前缀区间的 state 怎么存

可以存入数组，索引和字符位置一一对应
也可以存入Map，这里选择Map
- key： state 值
- value：对应在字符串中的位置
为了书写方便，转成十进制，比如 00110 就存 6

寻找满足条件的state

遍历过程中，边存state,要边在Map中查找；
看看有没有之前存过的，与当前state相同的state
如果有，则可能不止一个，要根据value值，求出它离当前位置的距离，找出有着最长距离的那个，就是我们想要的最大子串长度。

思路

准备一些变量

– vowel，元音对照表，元音和对应的二进制数

– map，初始放入 0: -1 键值对，代表 [0,-1] 对应的 state 为 00000 ，即十进制 0

– state，保存当前前缀区间的 state ，初始值 0

遍历，如果遍历到元音，获取它对应的二进制数，异或「上一个 state」，求出当前 state
往 map 存入 state，边存边查看「与当前 state 相等的、过去存下的 state 的位置」
求出它们间的距离，取到最大的。

时间复杂度：O(n) 空间复杂度：O(常数)

function findTheLongestSubstring(s: string): number {
    
    let state = 0;
    const map = new Map();
    map.set(0,-1);
    let vowels = { a:1 , e:2 , i:4 , o:8 , u:16 };
    let res = 0;

    for(let i = 0; i < s.length ; i++ ){   //进行一次遍历
        if (vowels[s[i]] !== undefined) {     //判断当前字符串是否是元音字符
            state ^= vowels[s[i]];
            if(map.get(state) === undefined){
                map.set(state,i); // 如若没有，在哈希表中储存
             } 
        }

        let distance = i - map.get(state);
        res = Math.max(res,distance);
    }

    return res;
    
};

原创文章，作者：dweifng，如若转载，请注明出处：https://blog.ytso.com/273216.html

JS/TS算法—状态压缩

位运算

位运算符

leetcode题精选

[169] 多数元素

[136] 只出现一次的数字

[187] 重复的DNA序列

[1371] 每个元音包含偶数次的最长子字符串

发表回复

JS/TS算法—状态压缩

位运算

位运算符

leetcode题精选

[169] 多数元素

[136] 只出现一次的数字

[187] 重复的DNA序列

[1371] 每个元音包含偶数次的最长子字符串

相关推荐

发表回复