UFT-8工作日志-è½¯ä»¶ä¸çççè»

回到动态网站了，这里需要考虑进行程序上的合并，难度不算大，但需要考虑原有的后台连接都仍是可以工作的。其次是所有的后台程序连接都要带上 dochid，同时，由于所有的程序文件已经转为公共，这个目录也成为一个可以外挂的目录了。总而言之，这里就成了另一个大博客。这个过程需要大约一天左右的时间。大概应该在系统批发布后再进行。事实上，这是检拾动态网站的工作，耗时，其中也包括了帮助部分，还要考虑 lauragao的理解能力有限，需要应付这样那样的疑问。所以目前还是暂不处理为好。

对于搜索引擎仍然没有什么明确的解决方案。刚刚的，开发服务器给一个北京的搜索引擎出垮了，而且是连接冲跨，连apache也当掉。再次提示需要对搜索引擎进行处理。但是，除非把动态响应的部分静态化，实在没有什么更好的办法。如果既要使用动态响应，又要实现对搜索引擎强度的限制，唯一的办法就是就是建立一个缓存核对IP的记录。

使用xmlmemorybase目前虽然可用，但从长久看，却不见得如此，主要原因在于，这个memorybase需要改成每次读写的操作，同时，目前没有进一步的如是否存在等功能。因此，不太适合用于这个搜索引擎的核证。目前的时间也不足以完成这个dabase系统的升级。另外，按最后时间段的算法的确不需要一个单独的计时器，但是，同时也会让许多搜索引擎的访问得到空值，难说物有所值；与此同时，又不允许增多一个计时器。

因此，完整的解决方案是有关联性的，应该是做一个全局性的计时服务， cron,然后，把目前的基表转换成每次读入并可以记录它的某些属性；对于simplebase需要更详细的考虑。这个计时器同时可以用到这个搜索引擎的核证上。它的原理是：建立一个集，记录下每一个时段的访问IP，隔一段时间就清空，一个时段可调，令存储的IP数不多于千，系统强大的话可以达到万以上。如果IP已经存在，就把它的计数加一，一个时段的访问超出一定限额，就拒绝访问。这样，可以很容易地发现搜索引擎。预先建立一个已知搜索引擎的地址列表，如果遇到超数的IP，就检查一下它的pattern(regular expression)是不是已知中的某一款，如果是大款，GOOGLE，BAIDU之类，就放行，否则，就象上面所说的把它禁止。显然，完成一个公用计时器，是上面的关键，把它与database的升级结合完成，效率会更高，不是今天了。

在静态的页中带上连接包括：到主域的连接，不宜用script打出来，连iframe都不算合适，更适于使用静态连接,以便对主域的pr有所帮助；其次，是一个指向强大下载甚至是刷新地址的页面，这样才可以加大流量，最后，是需要一个指向当前域的地址，以便可以调节会话；或者，还需要一个统计网址，以便知道这个网页的访问量有多大。

另外，发现了另一个象51yes的统计网址，看来这类网址还特别多呢

è½¯ä»¶ä¸çççè»_ UFT-8工作日志

Friday, October 07, 2005

0 Comments:

Previous Posts

èªæä»ç»

è½¯ä»¶ä¸çççè»_ UFT-8工作日志

Friday, October 07, 2005

0 Comments:

Previous Posts

èªæä»ç»

è½¯ä»¶ä¸çççè»_ UFT-8工作日志

èªæä»ç»