自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Thinkgamer博客

《推荐系统开发实战》作者,「搜索与推荐Wiki」公号负责人,CyanScikit科技创始人...

原创 Python分析和实现基于用户和Item的协同过滤算法

打开微信扫一扫,关注《搜索与推荐Wiki》 1:协同过滤算法简介 2:协同过滤算法的核心 3:协同过滤算法的应用方式 4:基于用户的协同过滤算法实现 5:基于物品的协同过滤算法实现 一:协同过滤算法简介 关于协同过滤的...

2016-05-30 12:08:02

阅读数 49961

评论数 49

原创 《hadoop进阶》PeopleRank从社交关系中挖掘价值用户

转载请注明出处: 转载自  Thinkgamer的CSDN博客: blog.csdn.net/gamer_gyt 代码下载地址:点击查看 1:PageRank 与 PeopleRank 2:需求分析:挖掘CSDN博客的价值用户 3:算法模型:PeopleRank算法 4:架构设计:从数据准...

2016-05-29 22:42:53

阅读数 13750

评论数 4

原创 《排序算法》——希尔排序,桶式排序(Java)

一:希尔排序 也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法, 先取一个小于n的整数d1作为第一个增量,把文件的全部记录分组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序; 然后,取第二个增量d2<d1重复上述的分组和排序,...

2016-05-27 11:13:11

阅读数 2251

评论数 0

原创 《hadoop进阶》web日志系统 KPI指标的分析与实现

推广一下个人的微信公众号【搜索与推荐Wiki】 转载请注明出处: 转载自 T...

2016-05-27 01:08:21

阅读数 14295

评论数 5

原创 《矩阵》——稀疏矩阵(Java)

转载请注明出处: 转载自  Thinkgamer的CSDN博客:blog.csdn.net/gamer_gyt 1:稀疏矩阵的背景 2:什么是稀疏矩阵? 3:为什么要对稀疏矩阵进行压缩存储以及压缩存储的方式? 4:稀疏矩阵的相关运算 一:背景         第一此介绍稀疏矩阵是在数据结...

2016-05-26 13:07:44

阅读数 7201

评论数 0

原创 《图论》——图的存储与遍历(Java)

一:图的分类 1:无向图         即两个顶点之间没有明确的指向关系,只有一条边相连,例如,A顶点和B顶点之间可以表示为 也可以表示为,如下所示                       2:有向图         顶点之间是有方向性的,例如A和B顶点之间,A指向了B,B也指向了A,...

2016-05-25 15:28:59

阅读数 13879

评论数 3

原创 《树》——二叉树(Java)

完整代码下载地址: 点击下载 1:二叉树的分类 (1)空二叉树——如图(a); (2)只有一个根结点的二叉树——如图(b); (3)只有左子树——如图(c); (4)只有右子树——如图(d); (5)完全二叉树——如图(e)。 2:二叉树的相关术语 树的结点:包含一个数据元素...

2016-05-22 20:29:34

阅读数 2282

评论数 0

原创 《链表》——单向链表和双向链表(Java)

完整的代码地址为:github  点击查看 单链表 单链表包括数据域和指向下一个节点的指针域,其结构如上图所示 首先定义一个数据类: class DATA{ //定义链表的一个节点 String key; //节点的关键字 String name; ...

2016-05-20 20:03:36

阅读数 3471

评论数 0

原创 《栈 队列》——栈与队列(Java)

一:对列 队列是一种先进先出的数据结构 实现代码: package Queue; /* * 使用java构建队列,并模拟实现队列的入队和出对方法 */ public class Queue { //队列类 private int maxSize; //定义队列的长度 pri...

2016-05-19 21:13:27

阅读数 2950

评论数 0

原创 《排序算法》——归并排序,插入排序(Java)

一:归并排序 算法步骤: 1、申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列 2、设定两个指针,最初位置分别为两个已经排好序列的起始位置 3、比较两个指针所指向的元素,选择相对小的元素到合并空间,并移动指针到下一位置 4、重复步骤3直到某一指针达到序列结尾 5、将另一序列下...

2016-05-18 19:45:53

阅读数 2323

评论数 0

原创 《机器学习实战》利用PCA来简化数据

=====================================================================   《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法     github 源码同步:http...

2016-05-15 19:08:18

阅读数 5419

评论数 2

原创 《机器学习实战》预测数值型数据-回归(Regression)

回归的一般方法: (1)收集数据:采用任意方法收集数据 (2)准备数据:回归需要数值型数据,标称型数据将被转化成二值型数据 (3)分析数据:绘出数据的可视化二维图将有助于对数据做出理解和分析,在采用缩减法求得新回归系数之后,可以将新拟合线在图上作为对比 (4)训练算法:求得回归系数 (5)测试算法...

2016-05-14 18:33:14

阅读数 13303

评论数 6

原创 《机器学习实战》AdaBoost算法的分析与实现

=====================================================================   《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法     github 源码同步:https:...

2016-05-11 10:41:52

阅读数 9013

评论数 3

原创 非二元属性的关联规则挖掘和关联规则的评价

=====================================================================   《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法     github 源码同步:https...

2016-05-10 19:39:11

阅读数 3875

评论数 0

原创 《机器学习实战》使用Apriori算法和FP-growth算法进行关联分析(Python版)

1:关联分析 2:Apriori算法和FP-growth算法原理 3:使用Apriori算法发现频繁项集 4:使用FP-growth高效发现频繁项集 5:实例:从新闻站点点击流中挖掘新闻报道 以下程序用到的源代码下载地址:GitHub 一:关联分析 1:相关概念 关联分析(associatio...

2016-05-09 19:29:27

阅读数 26666

评论数 22

原创 关于Python编码问题的一些看法

近期在做一个图书推荐系统的项目,其中在登录模块涉及到了中文字符,这一直是个很烦人的问题,因为编码格式太多,且不同编码格式下相同的字符的长度也不一样,所以在字符编码,特别是中文编码这一块很让人头疼,但幸好这一次,解决了问题,下面我就简单的谈一谈我对他的理解 在廖学峰的博客上他对编码做了一个简答的介绍...

2016-05-08 12:02:17

阅读数 3381

评论数 0

原创 scikit-learn学习之SVM算法

====================================================================== 本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正 转载请注明出处,谢谢 =======...

2016-05-04 21:12:10

阅读数 56479

评论数 12

原创 eclipse编写MapReduce程序依赖的JAR包

吐槽一下:        小编之前编写MR程序都是把hadoop解压之后的所有文件全部BuildPath进去的,近期发现这样不行,不能长久做,如果要把程序打包成jar文件在终端运行的话,是不是会太..... 所以小编就一顿尝试下,先是尝试安装maven,可是发现在Ubuntu的eclipse整了...

2016-05-03 14:04:03

阅读数 5349

评论数 0

提示
确定要删除当前文章?
取消 删除