“结巴”分词:做最好的Python分词组件 - Alan Liu - 博客频道 - CSDN.NET
http://blog.csdn.net/liuzhoulong/article/details/8051676
Hadoop分布式环境下的数据抽样 - Alan Liu - 博客频道 - CSDN.NET
http://blog.csdn.net/liuzhoulong/article/details/6965471
大数据排序或取重或去重相关问题 - Alan Liu - 博客频道 - CSDN.NET
http://blog.csdn.net/liuzhoulong/article/details/6972331
Hadoop in China2011参会总结 - Alan Liu - 博客频道 - CSDN.NET
http://blog.csdn.net/liuzhoulong/article/details/7079042
hadoop和hive的实践应用(三)——hive的基本应用 - Alan Liu - 博客频道 - CSDN.NET
http://blog.csdn.net/liuzhoulong/article/details/6447075
http://blog.csdn.net/liuzhoulong/article/details/6447075