`
文章列表

CentOS6.3安装MySQL5.5

yum remove mysql wget http://www.cmake.org/files/v2.8/cmake-2.8.4.tar.gz tar -xvf cmake-2.8.4.tar.gz cd cmake-2.8.4; ./bootstrap   ---------------------------------------------CMake 2.8.4, Copyright 2000-2009 Kitware, Inc.---------------------------------------------Error when bootstrapping C ...
一.LVS是什么? LVS的英文全称是Linux Virtual Server,即Linux虚拟服务器。它是我们国家的章文嵩博士的一个开源项目。在linux内存2.6中,它已经成为内核的一部分,在此之前的内核版本则需要重新编译内核。二.LVS能干什么? LVS主 要用于多服务器的负载均衡。它工作在网络层,可以实现高性能,高可用的服务器集群技术。它廉价,可把许多低性能的服务器组合在一起形成一个超级服务器。它 易用,配置非常简单,且有多种负载均衡的方法。它稳定可靠,即使在集群的服务器中某台服务器无法正常工作,也不影响整体效果。另外可扩展性也非常好。
相似性和相异性的度量       相似度:两个对象之间的相似度(similarity) 的非正式定义是这两个对象相似程度的数值度量。因而,两个对象越相似,它们的相似度越高。通常,相似度是非负的,并常常在0(不相似)和( ...

SolrJ的使用

    博客分类:
  • solr
CommonsHttpSolrServer     CommonsHttpSolrServer 使用HTTPClient 和solr服务器进行通信。 Java代码   String url =  "http://localhost:8983/solr" ;      SolrServer server =  new  CommonsHttpSolrServer( url );   [java] view plain copy String url =  "http://lo ...
下面是linux下安装apache的完整代码,系统是redhat5.5下载httpd-2.2.6.tar.bz2 把httpd-2.2.6.tar.bz2放到/soft 下[root@localhost ~]#cd /soft[root@localhost soft]#tar jxvf httpd-2.2.6.tar.bz2 //解压apache的压缩包[root@localhost soft]#cd httpd-2.2.6 //定位到httpd-2.2.6 文件夹下[root@localhost httpd-2.2.6]#ls //查看显示httpd-2.2 ...
mysql根据配置文件会限制server接受的数据包大小。 有时候大的插入和更新会被max_allowed_packet 参数限制掉,导致失败。 查看目前配置 show VARIABLES like '%max_allowed_packet%'; 显示的结果为: +--------------------+---------+ | Variable_name | Value | +--------------------+---------+ | max_allowed_packet | 1048576 | +--------------------+-------- ...

oracle 数据仓库

一.Data warehouse和OLTP系统的对比 和OLTP系统不同,数据仓库的主要目的是集中统一的存放业务的历史数据,以便用于查询和分析。 数据仓库理论的鼻祖William Inmon给数据仓库的特性归纳为一下四点: 面向主题(Subject Oriented) ...

Materialized View

Oracle的实体化视图提供了强大的功能,可以用在不同的环境中,实体化视图和表一样可以直接进行查询。实体化视图可以基于分区表,实体化视图本身也可以分区 。 主要用于预先计算并保存表连接或聚集等耗时较多的操作 ...
 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。   本文的目的就是对 ...
    背景 根据控制对象的粗细程度,访问控制可分为粗粒度和细粒度两种 通常把规定访问整个数据库表或由基本表导出的视图的某个层称为粗粒度的访问控制,而细粒度控制则是把安全控制细化到数据库的行级或列级。 我们给银行上了一套系统,银行的政策允许所有财务经理可以访问所有账户持有人的信息,但在最近,对该政策做了改变只允许财务经理访问特定的客户集,那么为了使应用程序符合新的政策,我们必须对应用程序进行修改,有三种选择 1.          修改应用程序代码,使所有 SQL 语句都包含一个 WHERE 子句。但如果将来 ...
数据预处理           聚集(aggregation):将两个或多个对象合并成单个对象。例如不同地点的事物数据集,合并。                                              优点:减少分析的数据可以减少占用空间和处理时间,可以使用更大开销的挖掘算法。                               缺点:可能会丢失模式。           抽样:是一种选择对象自己进行分析的常用方法。抽样长期用于数据的事先调查和最终的数据分析。                            ...
0. 前言 这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子。更严格的公式和计算我会在相应的地方注明参考资料。贝叶斯方法被证明是非常 general 且强大的推理框架,文中你会看到很多有趣的应用。 1. 历史 托马斯·贝叶斯(Thomas Bayes)同学的详细生平在 这里 。以下摘一段 wikipedia 上的简介: 所谓的贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有N个白球,M个黑球 ...
数据类型 1.属性与度量 属性(attribute)是对象的性质或特性,它因对象而异,或随时间而变化。 测量标度(measurement scale)是将数值或符号值与对象的属性相关联的规则(函数) 属性类型:我们可以定义四种属性类型,标称(nominal),序数(ordinal),区间(interval),比率(ratio)。     数据质量 注重理解和提高数据质量,将改进分析结果的质量。 通常的数据质量问题:存在噪声和利群点、 ...
       数据挖掘是什么                      数据挖掘时数据库中知识发现(knowledge discovery in database,KDD)不可缺少的一部分,而KDD是将未加工的数据转换为有用信息的整个过程。        
【51CTO综合报道】围脖,织围脖——这是什么?冬天到了,织条围脖保暖吗?错,这是网络流行用语。这还是大家的生活方式,生活态度。“找我?来我微博啊!”最近身边的朋友都在织啊织,你不织?你就是“奥特曼”。那么 ...
Global site tag (gtag.js) - Google Analytics