直通BAT面试算法精讲--位运算
位运算
位运算基本属于神仙题,见过就会,没见过就不会,靠平时积累
案例一
前提知识:
和位运算相关的不容过滤器。是一道大数据题目也和位运算有关系。
普通思路:
解题思路:
凡是遇见 网页黑名单、垃圾邮件过滤、爬虫网址判断等,对空间要求严格,一般是使用布隆过滤器原理
布隆过滤器:
布隆过滤器原理:
长度为M的数组记为bitarry,其中每个位置只占1bit,只有0(白)和1(黑)两种状态。
一共有K个哈希函数,都能承接输入的64字节,输出域都大于等于m,哈希函数之间彼此之间相互独立。算出的结果可能相同可能不同。
对算出的结果对M取余,取余的结果在bitarray相应的位置上设置为1(涂黑)或0。上每个哈希函数的
布隆过滤器的计算: