UindexWeb Build4525开源蜘蛛程序正式版(源代码)

http://www.opencpu.com/topic.php?id=2

UindexWeb简介

一个一直在改进的,努力成为简洁,最易用的开源蜘蛛程序;
一个综合ICS,JCL,Lucene.Net,C#优势的展示应用;
一个努力体现Delphi开发原生代码魅力的程序。

如何使用?
下载回这个安装包以后,你就拥有了搭建属于自己搜索引擎所需的所有资源。

第一步:使用UindexWeb.exe抓取网页,来填充数据库,有了这个数据库,建立搜索引擎的工作就完成了一半。
第二步:使用Publish\bin\Release\PublishWeb.exe将上一步抓到的数据库变成网页程序可以使用的Lucene.Net索引文件,即建立索引。
第三步:复制建立索引生成的目录及文件到wwwroot下面,然后上传到自己网站的根目录下,完成,测试一下吧!

更新日志

2:03 2009-11-27
平沙雁:+发现R4.5(build4525)仅收录英文内容的问题,已解决
平沙雁:-去除代码中对UIStatusBar,Uindex.dpk的引用
平沙雁:+发现修正一处导致服务器返回HTTP500的错误

0:31 2009-11-19
+完善Access数据库为只读时出现的无法搜索
+更正SQL子查询集合命名与SQL Server兼容性问题
+解决内存泄漏导致的一处程序错误
+解决在某些情况下出现的ASCII转码失败的问题
+默认支持IE的HTTP代理设置
-去除对DevExpress Navbar的引用

19:41 2009-9-16
+加入二级域名深度的限制,默认不限制
+文件类型编号采用宏定义形式,提高可读性
+修正无法收录FTP形式文件的错误
+修正一处?&形式参数的自动更正无效的问题
-去除Access自动压缩功能
+加入网站分页显示解决站点数上万以后界面卡的问题
+修正一处错误的链接导致的死循环
+修正一处收录注释内容中链接的问题
+链接分析算法的细微改进
+解决一处导致正常网页不被收录的问题
+解决一处保存URL与站点不对应的问题
+解决无标题网页标题为上一网页标题的问题
+规范数据库字段命名
+加入错误报告功能
+修正一处界面显示错误
+其他Bug若干
-计算网页PageRank的算法部分,改为在建立索引阶段计算
-网站管理员的联系方式相关功能

下载4525版UindexWeb.rar

获取当前最新的UindexWeb源代码,可以使用SVN客户端
抓取地址:http://svn.opencpu.com/svnroot/uindex/UindexWeb/
在线浏览:http://svn.opencpu.com/viewvc/uindex/
提示证书信任时选接受。

需要项目管理权限、合并代码、或修改bug的开发人员也可在此申请!

用到的3个组件都可以从网上下载到。

依次安装jcl,ics,flatstyle,安装方法如下:

jcl解压后运行Install.bat,注意选中exception和debug相关功能,然后安装,OK

ics解压后进入trunk\Delphi\Vc32目录,双击OverbyteIcsDel70.dpk打开后在options/compiler页面设置输出到您的lib目录,然后按install,OK

flatstyle解压后先双击FlatVcls.dpk安装,再双击FlatStyle.dpk安装。

完成上面3步以后,就可以用delphi打开UindexWeb目录下UindexWeb.dpr

编译出UindexWeb.exe目标文件,开始搭建属于您自己的开源搜索引擎!

JCL主页
http://sourceforge.net/projects/jcl/

ICS主页
http://www.overbyte.be/

FLATSTYLE
http://www.2ccc.com/article.asp?articleid=4321



发表评论

您的电子邮箱地址不会被公开。

25 − 23 =