Friday, October 07, 2005

回到动态网站了,这里需要考虑进行程序上的合并,难度不算大,但需要考虑原有的后台连接都仍是可以工作的。其次是所有的后台程序连接都要带上 dochid,同时,由于所有的程序文件已经转为公共,这个目录也成为一个可以外挂的目录了。总而言之,这里就成了另一个大博客。 这个过程需要大约一天左右的时间。大概应该在系统批发布后再进行。事实上,这是检拾动态网站的工作,耗时,其中也包括了帮助部分,还要考虑 lauragao的理解能力有限,需要应付这样那样的疑问。所以目前还是暂不处理为好。

对于搜索引擎仍然没有什么明确的解决方案。刚刚 的,开发服务器给一个北京的搜索引擎出垮了,而且是连接冲跨,连apache也当掉。再次提示需要对搜索引 擎进行处理。但是,除非把动态响 应的部分静态化,实在没有什么更好的办法。如果既要使用动态响应,又要实现对搜索引擎强度的限制,唯一的办法就是就是建立一个缓存核对IP的记录。

使 用xmlmemorybase目前虽然可用,但从长久看,却不见得如此,主要原因在于,这个memorybase需要改成每次读写的操作,同时,目前没 有进一步的如是否存在等功能。因此,不太适合用于这个搜索引擎的核证。目前的时间也不足以完成这个dabase系统的升级。另外,按最后时间段的算法的确 不需要一个单独的计时器,但是,同时也会让许多搜索引擎的访问得到空值,难说物有所值;与此同时,又不允许增多一个计时器。

因此,完整的 解决方案是有关联性的,应该是做一个全局性的计时服务, cron,然后,把目前的基表转换成每次读入并可以记录它的某些属性;对于simplebase需要更详细的考虑。这个计时器同时可以用到这个搜索引擎的 核证上。它的原理是:建立一个集,记录下每一个时段的访问IP,隔一段时间就清空,一个时段可调,令存储的IP数不多于千,系统强大的话可以达到万以上。 如果IP已经存在,就把它的计数加一,一个时段的访问超出一定限额,就拒绝访问。这样,可以很容易地发现搜索引擎。预先建立一个已知搜索引擎的地址列表, 如果遇到超数的IP,就检查一下它的pattern(regular expression)是不是已知中的某一款,如果是大款,GOOGLE,BAIDU之类,就放行,否则,就象上面所说的把它禁止。显然,完成一个公用计时器,是上面的关键,把它与database的升级结合完成,效率会更高,不是今天了。

在静态的页中带上连接包括:到主域的连接,不宜用script打出来,连iframe都不算合适,更适于使用静态连接,以便对主域的pr有所帮助;其次, 是一个指向强大下载甚至是刷新地址的页面,这样才可以加大流量,最后,是需要一个指向当前域的地址,以便可以调节会话;或者,还需要一个统计网址,以便知 道这个网页的访问量有多大。

另外,发现了另一个象51yes的统计网址,看来这类网址还特别多呢

0 Comments:

Post a Comment

<< Home