预览模式: 普通 | 列表
         今天去把服务器系统升级到x64 windows 2008 with sp2 ,这样java可以 装x64 对内存的支持会非常不错。便于做学术搜索。

    并且windows 2008 x64 with sp2增加了安全性。

    希望安装过程顺利。

查看更多...

Tags: windows 2008

分类:website | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 34

CentOS 5  Web服务器 安全配置

主要做为历史记录,以后用。另外很少见这么好的编译的文章,其实我不推荐用编译安装。但这个文章不错.
V3.0 2007年11月11日 将搭建教程划分阶段以适应不同需要。加入程序优化,程序安全,加入memcache,squid, mod_security等高级应用, 安装vBulletin+vBseo, 服务器安全设置,以及日常管理功能。
V2.0 2007年10月18日 操作系统更新为centos 5.0 apache 更新为2.2.6版本,php更新为5.2.5, mysql 更新为5.0.46, Zend Optimizer 更新为3.3.0。解决新平台下的一些问题。修正文字错误。
v1.2 2007年2月12日 apache 更新为2.2.4版本,增加mod_ssl和openssl支持,增加apr和apr-util的编译, php更新为5.2.1,增加集成Suhosin补丁,mysql 更新为5.0.33, Zend Optimizer 更新为3.2.2,增加phpmyadmin。修改一些文字错误。
v1.0 2007年1月11日

查看更多...

Tags: CentOS 5.3

分类:服务器维护 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 157

Nutch的配置使用

先介绍下:Nutch主要分为两个部分:爬虫crawler和查询searcher。Crawler主要用于从网络上抓取网页并为这些网页建立索引。 Searcher主要利用这些索引检索用户的查找关键词来产生查找结果。两者之间的接口是索引,所以除去索引部分,两者之间的耦合度很低。
  Crawler和Searcher两部分尽量分开的目的主要是为了使两部分可以分布式配置在硬件平台上,例如将Crawler和Searcher分别放在两个主机上,这样可以提升性能。


环境:JDK1.6  Centos 5

查看更多...

Tags: nutch

分类:website | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 147

nutch 应用

  在Google里面搜索了一些Nutch的资料,还真不多。今天画了两个小时搞了一通,把一些心得纪录下来。

我的jdk 是1.5.x ,Tomcat是5.0.x

1 下载0.7.2 版本的包:里面已经包含了war文件,所以不需要Ant编译了

查看更多...

Tags: nutch

分类:程序开发 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 120

中小学教师培训的问题分析与对策

中小学教师培训的问题分析与对策
The Analyses and Countermeasures on the Teachers" Training Issue of Primary and Secondary School
论文作者方成
论文导师涂艳国,论文学位硕士,论文专业教育管理
论文单位华中师范大学,点击次数1,论文页数46页File Size1531k

查看更多...

Tags: paper.dic123.com 论文大全

分类:毕业论文 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 136
 互联网文章的相互复制,造成了互联网上存在大量的重复内容,这些重复内容,给搜索引擎带来了巨大的压力,搜索引擎在工作时,就需要对重复内容进行识别。那么搜索引擎是根据什么原理来进行重复内容的识别的呢?
  有的SEO在实践中提出,为了让搜索引擎收录自己的页面,可以修改标题和部分内容的文字,可以让搜索引擎收录页面;也有SEO认为搜索引擎还将页面的格式脚本也进行比较。
  事实上,搜索引擎识别重复内容的原理相当简单,并是不是有些SEO想象的那样拿文章的一段文字和另一篇文章去匹配,要是这样的话,搜索引擎的重复内容识别的效率就太低了。
  搜索引擎在识别重复内容之前,已经对页面内容进行了消噪和分词,消噪是指将页面的模板、广告等噪音过滤掉,留下文章的信号。在分词时,已经去掉了页面的脚本代码以及停止字。分词结束后,对每个分词出现的次数进行统计,取出现频率最高的三个或五个关键字,假设为A、B、C三个关键字,分别出现了10次、8次和5次,那么就形成A10B8C5这样一串字符,对此进行如MD5或其它形式的编码后形成一串数字,我们称这串数字为这篇文章的信息指纹,然后那这串信息指纹去数据库中检索,如果已经存在的话,则可以认为这个页面是重复内容。
  当然,仅仅采用这样一种方式进行重复内容的识别,存在很大的漏洞,比如有人将核心关键字修改一下,或者人为增加或减少核心关键字来进行欺骗。

查看更多...

Tags: 搜索引擎 重复内容

分类:website | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 139
如果没有经过适当的处理和优化,WordPress博客中将有很多内容重复的页面,而这些重复内容会不利于搜索引擎的索引。本文整理和归纳了关于“重复收录“的一些资料和好的建议,将全面分析“解决博客内容被重复收录“的途径:

1. WordPress博客中有哪些“重复内容“

(a) 首页显示的文章与独立文章页面的重复(特别是首页输出全文的blog)

查看更多...

Tags: 网页内容重复

分类:website | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 120
   写得太好了,转过来。


    我的白领朋友们,如果我是一个初中没毕业就来沪打工的民工,你会和我坐在“星巴克”一起喝咖啡吗?不会,肯定不会。比较我们的成长历程,你会发现,为了一些在你看来唾手可得的东西,我却需要付出巨大的努力。

查看更多...

分类:程序开发 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 149
以信息为中心的网络安全机制研究
Research of Information-Centric Network Security Mechanism
论文作者
论文导师李小勇;刘海涛,论文学位硕士,论文专业密码学
论文单位上海交通大学,点击次数2,论文页数71页File Size748K

查看更多...

Tags: paper.dic123.com 论文大全

分类:毕业论文 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 129
农用地价值构成与征地价格研究
Study on the Construction of Arable Land Value and the Price of Land Expropriation
论文作者谢建豪
论文导师许皞,论文学位硕士,论文专业土壤学
论文单位河北农业大学,点击次数3,论文页数59页File Size3402k

查看更多...

Tags: paper.dic123.com 论文大全

分类:毕业论文 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 133