Sunday, November 27, 2011

Daily Bookmarks 20111127

快速URL排重的方法
http://www.360doc.com/content/08/1031/15/3500_1855560.shtml
~/.trash » bloom filter 备忘(1)
http://grepk.com/?p=605
BloomFilter–大规模数据处理利器(解决空查问题) | dbafree首页
http://www.dbafree.net/?p=36
常用于web spider中URL排重的Bloom Filter算法学习… | 互联网,请记住我
http://www.162cm.com/archives/783.html
网络爬虫设计——URL去重存储库设计_守护地下铁_百度空间
http://hi.baidu.com/shirdrn/blog/item/40ed0fb1ceac4d5c0923029d.html

不简单的URL去重 - 智障大师 的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/historyasamirror/article/details/6746217
NoSQL数据库笔谈
http://sebug.net/paper/databases/nosql/Nosql.html#_8314717379700977_930601348298
Oracle Berkeley DB 中国研发团队的博客 » embedded
http://www.bdbchina.com/tag/embedded/
大量url去重问题 - jollyjumper的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/jollyjumper/article/details/6415723
程式扎記: [ Java Crawler ] 設計爬蟲佇列
http://puremonkey2010.blogspot.com/2011/10/java-crawler_20.html
Bloom Filter « Python recipes « ActiveState Code 22line good site
http://code.activestate.com/recipes/577684-bloom-filter/
Bloom filters and a simple spell checker in Python
http://lists.canonical.org/pipermail/kragen-hacks/2006-August/000431.html

搜索引擎重复网页发现技术分析(续) - 我的BT下载实验室 - ITeye技术网站 nice site title
http://wangdei.iteye.com/blog/376721

Coding Horror: URL Shortening: Hashes In Practice
http://www.codinghorror.com/blog/2007/08/url-shortening-hashes-in-practice.html

Crawling the Web
dollar.biz.uiowa.edu/~pant/Papers/crawling.pdf

布隆算法在url去重中的应用_菩提树_新浪博客 very nice site
http://blog.sina.com.cn/s/blog_7165756b0100odeu.html
K值聚类在同价位中的应用_菩提树_新浪博客
http://blog.sina.com.cn/s/blog_7165756b0100odij.html
布隆过滤器在网页去重中的应用-泪下的天空-我的搜狐 nice site C++實作 可看
http://jinyun2012.blog.sohu.com/163477317.html
Url排重Bloom Filter 算法、误差及其他 - 我要去桂林—田春峰的IT网志 - IT改进生活
http://blog.donews.com/accesine/archive/2007/01/23/1118640.aspx
larbin中URL的去重-Bloom Filter算法 - piziwang - ITeye技术网站
http://piziwang.iteye.com/blog/740394
Larbin : Parcourir le web, telle est ma passion
http://larbin.sourceforge.net/index-eng.html

THE VERY SIMPLE HASH TABLE EXAMPLE (Java, C++) | Algorithms and Data Structures
http://www.algolist.net/Data_structures/Hash_table/Simple_example
Python dictionary implementation | Laurent Luce's Blog
http://www.laurentluce.com/posts/python-dictionary-implementation/

nutch源代码阅读心得 - CookStar - 博客园
http://www.cnblogs.com/clarkchen/archive/2011/02/22/1960892.html




z

No comments: