Saturday, June 29, 2013

Daily Bookmarks 20130629

HBase在Facebook Message存储的使用经验总结 | Binospace
http://www.binospace.com/index.php/hbase-zai-facebook-message-cun-chu-di-shi-yong-jing-yan-zong-jie/
[HBase]KeyValue and HFile create - 吊丝码农 - ITeye技术网站
http://iwinit.iteye.com/blog/1827527
Th30z (Matteo Bertozzi Code): HBase I/O: HFile
http://th30z.blogspot.tw/2011/02/hbase-io-hfile.html
通过解析Hfile的index结构获取数据分布情况_Hadoop与分布式数据处理_ITPUB论坛-it168旗下专业技术社区
http://www.itpub.net/thread-1625291-1-1.html

Using HFile outside HBase at HUGUK #7 | Lanyrd
http://lanyrd.com/2010/huguk7/sxbw/


快速URL排重的方法
http://www.360doc.com/content/08/1031/15/3500_1855560.shtml
开源网络爬虫介绍及其比较 - Bill's Blog
http://ibillxia.github.io/blog/2010/08/20/several-open-source-web-crawlers-comparing/
网络爬虫设计—url排重算法布隆过滤器 (Bloom Filter) 详解 02_cphmvp
http://cphmvp.diandian.com/post/2013-01-17/40046782422
一种分布式网络爬虫的URL排重系统及方法 - IP.com
http://ip.com/patfam/zh/47647145

静态cache之log共现词分析 « 搜索技术博客-淘宝
http://www.searchtb.com/2013/06/%e9%9d%99%e6%80%81cache%e4%b9%8blog%e5%85%b1%e7%8e%b0%e8%af%8d%e5%88%86%e6%9e%90.html?spm=0.0.0.0.efcrfI
从狄仁杰的测字占卜到一淘网的Query分析之大结局 « 搜索技术博客-淘宝
http://www.searchtb.com/2011/01/from-augur-to-etao-query-analysis.html?spm=0.0.0.0.iMCbQH
从狄仁杰的测字占卜到一淘网的Query分析 « 搜索技术博客-淘宝
http://www.searchtb.com/2010/11/%e4%bb%8e%e7%8b%84%e4%bb%81%e6%9d%b0%e7%9a%84%e6%b5%8b%e5%ad%97%e5%8d%a0%e5%8d%9c%e5%88%b0%e4%b8%80%e6%b7%98%e7%bd%91%e7%9a%84query%e5%88%86%e6%9e%90.html?spm=0.0.0.0.iMCbQH




















No comments: