Ubuntu 下通过代理安装 Dropbox

最近迷上了 Dropbox 的快速跨平台同步功能,奈何天网恢恢,总在墙内,在国内访问 Dropbox 总是要翻越重重障碍。下面是在 Ubuntu 下通过代理安装 Dropbox 的简要步骤。 环境说明机子的环境是 Ubuntu 15.4, 64位。买了一个代理的账号,在 Ubuntu 下已经配置成功可以通过 Chrome 翻墙。 步骤 安装 Dropbox 在线安装文件。这边较为简单,Ubuntu 的软件中心就有,点击安装即可。 安装完 Dropbox 的在线安装文件后,直接在线安装由于墙的原因会失败,所以需要使用代理安装。基本明朗如下: sudo apt-get install proxychains sudo vi /etc/proxychains.conf //修改 socks...

Continue Reading →

七大数据降维算法

近来由于数据记录和属性规模的急剧增长,大数据处理平台和并行数据分析算法也随之出现。于此同时,这也推动了数据降维处理的应用。实际上,数据量有时过犹不及。有时在数据分析应用中大量的数据反而会产生更坏的性能。 最新的一个例子是采用 2009 KDD Challenge 大数据集来预测客户流失量。 该数据集维度达到 15000 维。 大多数数据挖掘算法都直接对数据逐列处理,在数据数目一大时,导致算法越来越慢。该项目的最重要的就是在减少数据列数的同时保证丢失的数据信息尽可能少。 以该项目为例,我们开始来探讨在当前数据分析领域中最为数据分析人员称道和接受的数数据降维方法。 缺失值比率 (Missing Values Ratio)该方法的是基于包含太多缺失值的数据列包含有用信息的可能性较少。因此,可...

Continue Reading →

如何撰写文献评述

文章评论不仅是其他作者文章的总结还包括对文章的评价。老师通常通过布置学生撰写文献评论来引导学生进入专业的研究领域。专家也经常需要对其他专家的工作进行评述。对文章主要论点和论据的理解是进行准确评述的必要条件。合理的评论文章的主题,论据以及理解进一步的研究点是撰写文章评述的重要元素。下面是撰写文献评论的一些参考意见。 撰写前的准备理解文献评述是什么文献评述是面向相关学科的专家而非一般读者的。在撰写文献评述时,应当总结文章的要旨、论据、地位和贡献以及最为重要文章对相关领域的贡献与影响。 文献评述不只是对文献的看法。你会需要通过文字来回应学术作者的思想。你需要综合思想、理论以及你自身的研究来回应。你对文章的评论是基于论据以及你自身的逻辑推理形成的。 文献评述仅仅是针对文献作者的研究,它并不包...

Continue Reading →

通往数据科学家之路

经常有人问我“要成为数据挖掘工程师或者数据科学家应该读什么书?”类似的问题。下面是一份建议书单,同时也是成为数据科学家的指南,当然,这不包括取得合适大学学位的要求。在深入探讨之前,数据科学家似乎需要掌握许多技巧,如:统计学、编程、数据库、演讲技巧、数据清理与变换知识。理想情况下,你需要具备以下技能: 了解统计学与数据预处理知识。 理解统计陷阱。你必须明白在统计分析过程中偏差与常见错误都将影响统计分析人员。 了解几个机器学习与统计技术的工作原理。 时间序列分析。 编程技巧 (R, Java, Python, Scala)。 数据库 (SQL and NoSQL Databases)。 网页爬虫 (Apache Nutch, Scrapy, Jsoup). 文本数据。 了解统计学一本不...

Continue Reading →

道林格雷画像

王尔德的 道林格雷画像 的主题始终是围绕着美这个主题来进行的,情节以画家霍华德,美少年道林格雷,享乐勋爵亨利三人之间的故事展开。演绎的是从美的诞生到幻灭的过程。 故事的主角道林格雷是伦敦的贵族美少年,拥有惊为天人的美貌,令画家霍尔德深深着迷,并且在一张画作中将他的美貌永远定格。从此道林格雷美貌永存,所有的一切衰老由这张如栩如生的画像承受。在书中最开始时,道林格雷的美是精神与肉体的完美结合,肉体美轮美奂,心地纯洁无暇;然而随着故事的推进,道林格雷的精神逐渐被腐蚀,直至最后跳楼自杀而亡。在整个过程中,亨利勋爵更像是历史旁观的推手。亨利勋爵在小说中的形象有王尔德自身的影子,玩世不恭,言辞犀利,还带着叛逆。在道林格雷变化的过程中,亨利勋爵一直在旁边鼓舞怂恿,从鼓励道林格雷享受青春,享受自己的美...

Continue Reading →

女士品茶——统计学外传

统计学作为二十一世纪的最为流行的应用数学分支,在大数据时代中扮演的角色越来越重要。机器学习、模式识别的主流方法大都依赖于数理统计,不论是何种模型,最终都能归结到误差函数最小化,假设检验等统计学结论。统计学的起源可以追溯到上一世纪,那么,在20世纪中,统计学的发展是怎样影响到科学革命的?就让我们来读读这本有趣的统计学科普读物女士品茶 吧! 概述千万别被书名所误导,本书既不谈美女,也不讲品茶,这是本地地道道的统计学科普读物。本书以二十世纪统计学的发展历程为线索,描述了参与这场统计学革命中一些著名统计学家的创造性工作。本书并未涉及到过多的概率统计理论知识,因此阅读本书不会需要过多的数学背景,当然,你也不应该指望从这本书能获得足够的统计学知识,毕竟这不是统计学教材。本书的主要线索是统计学家创造...

Continue Reading →

pdfscreen 宏包简介

第一次见 pdfscreen 是在现代数学老师的课堂上,最初是以为该宏包是用来做 Presentation 的。但其实 pdfscreen 宏包是用来让输出的pdf文档在保持通用文档可打印特性的同时适应在屏幕上显示。该宏包的功能主要是通过重定义页面的边距以及高度和宽度来实现。通过调整宏包选项,可以方便的实现从打印文档到显示文档之间的转换。首先我们来看一个简单的例子: \documentclass[a4paper,11pt]{article} \usepackage{xspace,colortbl} \usepackage[panelleft,chocolate,paneltoc,screen]{pdfscreen} \margins{.75in}{.75in}{.75in}{.75in...

Continue Reading →

在 LaTeX 中使用流程图

流程图是表达算法思想最为有效的图形工具。作为计算机专业的学生,我们经常需要在文档中使用流程图来描述算法。在 LaTeX 中使用流程图可以通过 TikZ 或 flowchart 宏包来实现,但从本质上来说 flowchart 宏包也是使用 TikZ 宏包来实现的。下面分别通过一个简单的例子来对这两种方法进行说明。 使用 flowchart 宏包绘制流程图flowchart 宏包根据 IBM 提出的流程图标准,定义了流程图中最常用的五种标准形状,包括: PROCESS: 一切函数过程 DECESION: 条件判断 PREDEFINED PROCESS:预定义过程 STORAGE: 数据存储 TERMINAL: 开始,结束 下面,我们通过一个简单的示例代码来说明,请注意看代码中的注释 ...

Continue Reading →

© 2017 圣者谛 All Rights Reserved.
Theme by hiero