朝伟 的个人资料我的神韵天堂照片日志 工具 帮助

日志


2008/8/11

小孩可以打酱油了

常在小说或影视剧甚至生活中的邻里寒暄中听到这么一句:
  “伢都可以打酱油了。”
  表面上看这是说一个小毛毛现在长大了,可是为什么要用打酱油来形容他长大了呢
  话说很多年前,大多数ZG人民的生活还都不好,那时也没什么所谓的商品房,普通百姓住的都是很简陋的茅草房。一家就只有一间,夫妻、孩子都住在一起,也就是一家人只有一张床可用。孩子还小的时候就没关系啦,但是,等孩子日渐长大,肯定就会干扰大人办事,或者问一下他们在做什么,或者会跟别人讲这事什么的。
    为这事,大人要嘿休就没那么随意了,晚上就基本上很难有机会,那就白天吧。那时的孩子又不像现在的,3岁就送去了幼儿园,没得书读滴,有可能成天呆在家。大人们就得想个办法把小孩支开,怎么办呢?有办法,老爸就把小孩拉过来,“儿啊,家里酱油没了,你去打点酱油回来哈……”小P孩就P巅P巅的去了。
    还有一个问题,如果打酱油的地方离家太近,往返的时间很短怎么办?当然有办法,老爸就给小孩一个碗(更狠的给碟子啥的),小孩端着酱油怕洒了,就不敢走快了啦;还有一个好处是,每次少打点,才可以隔一、两天又去打酱油。
    然后,就可以放心的嘿休嘿休嘿休………
    以上就为“小孩可以打酱油了”的传说中的典故了-。-

2008/8/2

基于XOOPS网站的SEO技巧

由于搜索引擎工程师坚持不懈地同Spammers作斗争,所以SEO在现在更重要的是不被当作Spammer处罚而不是“优化”。你必须注意几件事,否则,你会成为搜索引擎工程师同Spammer作斗争的牺牲品。考虑到这一点,我们总结了一些技巧,这些技巧分为三类:必须,推荐,避免。

正如我们以前介绍的,SEO和你的PR值增长没有什么关系。

你应当尝试获得更多的返回链接,并且避免被搜索引擎惩罚。被惩罚的网站即使PR再高也没用。

必须:标题

你网站的每一个项目都必须有一个标题,就我们看来,这是XOOPS网站SEO最重要的部分。为网页加标题并不是那么困难,只需要有一点PHP和MySQL知识即可。如果你一点也不了解PHP和MySQL知识,那么尽快学习吧!否则你管理网站就会有麻烦了,不仅是加标题这一方面。

关于加标题的技巧,请访问如下网页:

http://xoops-tips.com/news-article.storyid-69.htm

推荐:ShortURLs

顶级链接比二、三级链接要有更高的PR,ShortURLs的美妙之处在于,它把你所有的链接都转译成顶级链接。如果ShortURLs功能开启,那么你的网页要比相似内容的网页有更好的PR。

避免:被处罚

正如前面所提到的,更高的PR和搜索引擎排名没有直接关系。也许你的网站是PR6,但是如果你被处罚,那么你的网站内容可能被埋没到60或者80页。

1.访问你的网站是否有WWW

选择一种方式(有或者没有WWW),然后坚持用这种方式(做广告或者友情链接),否则你的网站会被处罚。具体技巧请访问:

http://xoops-tips.com/news-article.storyid-92.htm

为什么这么重要?内容重复——如果你的网站有两份完全相同的内容(一个网址有WWW,另一个没有),那么你可能会被处罚。

2.为模块使用nofollow标签

一条技巧——如果网页上的链接只是供人类使用而不是机器,那么请用nofollow标签。

机器去“投票”、“发送给朋友”、“评论”、“打印”或者“创建PDF文件”没有什么意义。就拿news模块来说,“打印”和“创建PDF文档”将会使你的网站陷入麻烦:有三份完全相同的内容,这三份内容都会被机器录入,你的网站将会被处罚。

运用nofollow标签的技巧请访问:

http://xoops-tips.com/news-article.storyid-97.htm

这个技巧是针对news模块的,但是这个技巧适用于其他的模块。

3.关键字

搜索引擎尤其讨厌关键字泛滥。新版本的news模块可以自动生成关键字,这也许会使你陷入麻烦。在Hervé发布更新版本之前,或者你想用自己的关键字,请参考这个技巧:

http://xoops-tips.com/news-article.storyid-79.htm
(第四部分——如何为网页添加自定义关键字)

因为关键字对搜索引擎不是那么重要,用你的标题作关键字就足够了。

4.PHPSessionIDs

请确认你的链接没有悬而未决的PHPSessionID,在Google上检查:

site:www.yoursite (或者你的真实URL)

查看搜索结果, 看看是否清理掉了PHPSessionID。

清理掉PHPSessionID的技巧请访问这里:

http://xoops-tips.com/news-article.storyid-62.htm

为什么PHPSessionID对网站排名有害?

因为如果你的链接有悬而未决的PHPSessionID的话,每次机器访问同一个链接却用不同的PHPSessionID,机器会认为这是一个新网址并且把它摘录。这样的话你的网站就会有巨大数量的重复内容录入搜索引擎,你的网站迟早要被惩罚。

最后关于SEO的一点思考

SEO值得你的努力吗?是的。但是头脑中要有大框架:机制性的流量增加比通过搜索引擎的流量增加更好。搜索引擎的流量增加应当是你机制性的流量增加的补充。难道xoops.org需要通过搜索引擎增加流量?不!在这种情况下,SEO没什么用处。

你应当勤奋地在SEO方面工作,缓慢但是持续地通过搜索引擎增加你的网站流量,直到你的网站发展得像xoops.org那样,运用最简单有效的SEO技巧,不要过度优化。

2008/6/30

我背单词经验的总结

   中国人学英语都不得不背单词,我这一背就背了12年了,找到点投机取巧的经验,推荐给大家。
Rule No.1 不要背书!

     大部分人背书都是背了后面忘了前面,正襟危坐几个小时,其实记住的单词没几个,为什么?因为人的瞬时记忆力只能记忆5-7个东西,比如你妈妈叫你去买菜,七样以内你能记住,要是十几样你就得用笔记了。因此背书没用,那怎么办?就是分组背,记一组,测试一组,再记下一组
Rule No.2 不要用整段时间来背单词

    我看过很多人的每日计划,什么几点到几点是背单词时间。这个没用,你花几个小时光背单词,记忆效率绝对很低,脑袋都木掉,合上书一个字也想不起来。我高中的时候几届英语牛人就一个背单词方法—小卡片。每天没事就拿出来看一下,坚持不懈,效果绝对好。
Rule No.3 在遗忘临界点复习

    有个伟大的艾宾浩斯记忆曲线,非常厉害,只要按照那个曲线在遗忘临界点复习,5次复习就可以终身不忘。我高中用的文曲星就支持这个功能,我坚持用了高三一年,到现在所有单词都记得特别清楚,大学四六级压根没复习,就凭那会的底子一次闯关。
Rule No.4 语境记忆

     背单词绝对不能没有例句,中文的一个词你可以对他有很多种解释,英文也一样,如果没有例句帮你体会单词用法,光背词意在真正阅读的时候一定会抓瞎。我认识个老外,中国英语教育界的权威,他对我说:中国学生对单词 just recognize, never know. 所以一定要有例句。
Rule No.5 巧用学习工具

    现在科技发达,学习软件很多,巧加利用才能事半功倍。评点一下我这么多年来用的学习工具吧。
    首先,高中用的是文曲星上的单词记忆功能,好处是能随身携带,缺点是没有例句,而且测试的时候采取的是拼写的方式,实在太麻烦,影响速度。而且中翻英的背单词方法很不实用,必经考试的时候英翻中才是基本功。
    然后,是电脑软件我爱背单词之类,优点是有例句,缺点是自动提醒功能几乎没用,因为很难做到每天都打开电脑背单词。而且测试采取的四选一英翻中,老实说,电脑自动生成的选项一点干扰性都没有,测了和没测一样。更糟糕的是一开电脑就要上网玩游戏……
    至于什么好记星之类的东西真没法说,就是炒作……
    我现在用的是一款手机背单词软件,这款产品还是比较完美。
    第一,用手机背单词,可以做到随时随地利用零散时间背单词,就和用卡片背一个效果,还不用制作卡片那么麻烦。这款软件对手机要求也不高,我的诺基亚3100也能用,看他网上的宣传是所有支持java的手机都能用。
     第二,它是唯一一款有例句和习题的手机背单词软件,可以语境记忆,功能几乎和电脑软件一样了。我最喜欢的是它的测试方式,它是给出例句,让你判断单词在例句中的意思,并且提供10个选项,基本没有提示性,能测出真水平。而且它把一词多义的单词算作多个单词分开记忆,可以让我们重视单词的生僻意思,因为这些生僻意思是考试中的难点。
    第三,就是它的自动提醒复习功能了,这我就不用多说了,人人都是手机不离身的,等车等人的时候背背单词,定时复习,效果非常好,也十分方便。

2008/3/23

Syntax Highlighter for Windows Live Writer

这是Perl的代码
#!/usr/bin/perl # this is a demo print "this is a demo\n"; my $q = new CGI; print $q->header();
这是PHP的代码
<?php /** * Internal method to iteratively remove all unwanted tags and attributes * * @access protected * @param string $source Input string to be 'cleaned' * @return string $source 'cleaned' version of input parameter */ function remove($source) { $loopCounter = 0; /* * Iteration provides nested tag protection */ while ($source != $this->filterTags($source)) { $source = $this->filterTags($source); $loopCounter ++; } return $source; } // ?D?¡ìºÜÀÃ3???
中文支持很烂,如果觉得还能凑合着用那么访问Highlight4Writer官方下载
2008/2/11

重新回到msn space

重新回到msn space

2007/8/14

一些有用的东西

以下工具绝大多数都是开源的,基于GPL、Apache等开源协议,使用时请仔细阅读各工具的license statement

I. Information Retrieval
1. Lemur/Indri
The Lemur Toolkit for Language Modeling and Information Retrieval
/
Indri:
Lemur's latest search engine

2. Lucene/Nutch
Apache Lucene is a high-performance, full-featured text search engine library written entirely in Java.
Lucene是apache的顶级开源项目,基于Apache 2.0协议,完全用java编写,具有perl, c/c++, dotNet等多个port
/
/

3. WGet
GNU Wget is a free software package for retrieving files using HTTP, HTTPS and FTP, the most widely-used Internet protocols. It is a non-interactive commandline tool, so it may easily be called from scripts, cron jobs, terminals without X-Windows support, etc.
/software/wget/wget.html

II. Natural Language Processing
1. EGYPT: A Statistical Machine Translation Toolkit
/ws99/projects/mt/
包括GIZA等四个工具

2. GIZA++ (Statistical Machine Translation)
/GIZA++.html
GIZA++ is an extension of the program GIZA (part of the SMT toolkit EGYPT) which was developed by the Statistical Machine Translation team during the summer workshop in 1999 at the Center for Language and Speech Processing at Johns-Hopkins University (CLSP/JHU). GIZA++ includes a lot of additional features. The extensions of GIZA++ were designed and written by Franz Josef Och.
Franz Josef Och先后在德国Aachen大学,ISI(南加州大学信息科学研究所)和Google工作。GIZA++现已有Windows移植版本,对IBM 的model 1-5有很好支持。

3. PHARAOH (Statistical Machine Translation)
/licensed-sw/pharaoh/
a beam search decoder for phrase-based statistical machine translation models

4. OpenNLP:
/
包括Maxent等20多个工具

btw: 这些SMT的工具还都喜欢用埃及相关的名字命名,像什么GIZA、PHARAOH、Cairo等等。Och在ISI时开发了GIZA++,PHARAOH 也是由来自ISI的Philipp Koehn 开发的,关系还真是复杂啊

5. MINIPAR by Dekang Lin (Univ. of Alberta, Canada)
MINIPAR is a broad-coverage parser for the English language. An evaluation with the SUSANNE corpus shows that MINIPAR achieves about 88% precision and 80% recall with respect to dependency relationships. MINIPAR is very efficient, on a Pentium II 300 with 128MB memory, it parses about 300 words per second.
binary填一个表后可以免费下载
/~lindek/minipar.htm

6. WordNet
/
WordNet is an online lexical reference system whose design is inspired by current psycholinguistic theories of human lexical memory. English nouns, verbs, adjectives and adverbs are organized into synonym sets, each representing one underlying lexical concept. Different relations link the synonym sets.
WordNet was developed by the Cognitive Science Laboratory at Princeton University under the direction of Professor George A. Miller (Principal Investigator).
WordNet最新版本是2.1 (for Windows & Unix-like OS),提供bin, src和doc。
WordNet的在线版本是/perl/webwn

7. HowNet
/
HowNet is an on-line common-sense knowledge base unveiling inter-conceptual relations and inter-attribute relations of concepts as connoting in lexicons of the Chinese and their English equivalents.
由CAS的Zhendong Dong & Qiang Dong开发,是一个类似于WordNet的东东

8. Statistical Language Modeling Toolkit
/~prc14/toolkit.html
The CMU-Cambridge Statistical Language Modeling toolkit is a suite of UNIX software tools to facilitate the construction and testing of statistical language models.

9. SRI Language Modeling Toolkit
www.speech.sri.com/projects/srilm/
SRILM is a toolkit for building and applying statistical language models (LMs), primarily for use in speech recognition, statistical tagging and segmentation. It has been under development in the SRI Speech Technology and Research Laboratory since 1995.

10. ReWrite Decoder
/licensed-sw/rewrite-decoder/
The ISI ReWrite Decoder Release 1.0.0a by Daniel Marcu and Ulrich Germann. It is a program that translates from one natural languge into another using statistical machine translation.

11. GATE (General Architecture for Text Engineering)
/
A Java Library for Text Engineering


III. Machine Learning
1. YASMET: Yet Another Small MaxEnt Toolkit (Statistical Machine Learning)
/YASMET.html
由Franz Josef Och编写。此外,OpenNLP项目里有一个java的MaxEnt工具,使用GIS估计参数,由东北大学的张乐(目前在英国留学)port为C++版本

2. LibSVM
由国立台湾大学(ntu)的Chih-Jen Lin开发,有C++,Java,perl,C#等多个语言版本
/~cjlin/libsvm/
LIBSVM is an integrated software for support vector classification, (C-SVC, nu-SVC ), regression (epsilon-SVR, nu-SVR) and distribution estimation (one-class SVM ). It supports multi-class classification.

3. SVM Light
由cornell的Thorsten Joachims在dortmund大学时开发,成为LibSVM之后最为有名的SVM软件包。开源,用C语言编写,用于ranking问题
/

4. CLUTO
/~karypis/cluto/
a software package for clustering low- and high-dimensional datasets
这个软件包只提供executable/library两种形式,不提供源代码下载

5. CRF++
/~taku/software/CRF++/
Yet Another CRF toolkit for segmenting/labelling sequential data
CRF(Conditional Random Fields),由HMM/MEMM发展起来,广泛用于IE、IR、NLP领域

6. SVM Struct
/People/tj/svm_light/svm_struct.html
同SVM Light,均由cornell的Thorsten Joachims开发。
SVMstruct is a Support Vector Machine (SVM) algorithm for predicting multivariate outputs. It performs supervised learning by approximating a mapping
h: X --> Y
using labeled training examples (x1,y1), ..., (xn,yn).
Unlike regular SVMs, however, which consider only univariate predictions like in classification and regression, SVMstruct can predict complex objects y like trees, sequences, or sets. Examples of problems with complex outputs are natural language parsing, sequence alignment in protein homology detection, and markov models for part-of-speech tagging.
SVMstruct can be thought of as an API for implementing different kinds of complex prediction algorithms. Currently, we have implemented the following learning tasks:
SVMmulticlass: Multi-class classification. Learns to predict one of k mutually exclusive classes. This is probably the simplest possible instance of SVMstruct and serves as a tutorial example of how to use the programming interface.
SVMcfg: Learns a weighted context free grammar from examples. Training examples (e.g. for natural language parsing) specify the sentence along with the correct parse tree. The goal is to predict the parse tree of new sentences.
SVMalign: Learning to align sequences. Given examples of how sequence pairs align, the goal is to learn the substitution matrix as well as the insertion and deletion costs of operations so that one can predict alignments of new sequences.
SVMhmm: Learns a Markov model from examples. Training examples (e.g. for part-of-speech tagging) specify the sequence of words along with the correct assignment of tags (i.e. states). The goal is to predict the tag sequences for new sentences.

3. OpenPerlIDE: 开源的perl编辑器,内置编译、逐行调试功能
open-perl-ide.sourceforge.net/
ps: 论起编辑器偶见过的最好的还是VS .NET了,在每个function前面有+/-号支持expand/collapse,支持区域copy/cut/paste,使用ctrl+ c/ctrl+x/ctrl+v可以一次选取一行,使用ctrl+k+c/ctrl+k+u可以comment/uncomment多行,还有还有...... Visual Studio .NET is really kool:D

4. Berkeley DB
/
Berkeley DB不是一个关系数据库,它被称做是一个嵌入式数据库:对于c/s模型来说,它的client和server共用一个地址空间。由于数据库最初是从文件系统中发展起来的,它更像是一个key-value pair的字典型数据库。而且数据库文件能够序列化硬盘中,所以不受内存大小限制。BDB有个子版本Berkeley DB XML,它是一个xml数据库:以xml文件形式存储数据?BDB已被包括microsoft、google、HP、ford、motorola等公司嵌入自己的产品中去了

终于决定辞职了

再也不想在这个公司了重新找工作……

2007/7/1

35岁前成功的12条黄金法则


第一章:一个目标

一艘没有航行目标的船,任何方向的风都是逆风

1、你为什么是穷人,第一点就是你没有立下成为富人的目标

2、你的人生核心目标是什么?

杰出人士与平庸之辈的根本差别并不是天赋、机遇,而在于有无目标。

3、起跑领先一步,人生领先一大步:成功从选定目标开始

4、贾金斯式的人永远不会成功

为什么大多数人没有成功?真正能完成自己计划的人只有5%,大多数人不是将自己的目标舍弃,就是沦为缺乏行动的空想

5、如果你想在35岁以前成功,你一定在25至30岁之间确立好你的人生目标

6、每日、每月、每年都要问自己:我是否达到了自己定下的目标



第二章:两个成功基点

站好位置,调正心态,努力冲刺,35岁以前成功

(一)人生定位

1、人怕入错行:你的核心竞争力是什么?

2、成功者找方法,失败者找借口

3、从三百六十行中选择你的最爱

人人都可以创业,但却不是人人都能创业成功

4、寻找自己的黄金宝地

(二)永恒的真理:心态决定命运,35岁以前的心态决定你一生的命运

1、不满现状的人才能成为富翁

2、敢于梦想,勇于梦想,这个世界永远属于追梦的人

3、35岁以前不要怕,35岁以后不要悔

4、出身贫民,并非一辈子是贫民,只要你永远保持那颗进取的心。中国成功人士大多来自小地方

// 本文转自 C++Builder 研究 -
http://www.ccrun.com/article.asp?i=1002&d=c12b80

5、做一个积极的思维者

6、不要败给悲观的自己

有的人比你富有一千倍,他们也会比你聪明一千倍么?不会,他们只是年轻时心气比你高一千倍。

人生的好多次失败,最后并不是败给别人,而是败给了悲观的自己。

7、成功者不过是爬起来比倒下去多一次

8、宁可去碰壁,也不要在家里面壁

克服你的失败、消极的心态

(1)找个地方喝点酒

(2)找个迪厅跳跳舞

(3)找帮朋友侃侃山

(4)积极行动起来



第三章:三大技巧

1、管理时间:你的时间在哪里,你的成就就在哪里。

把一小时看成60分钟的人,比看作一小时的人多60倍

2、你不理财,财不理你

3、自我管理,游刃有余

(1)创业不怕本小,脑子一定要好

(2)可以开家特色店

(3)做别人不愿做的生意



第四章:四项安身立命的理念

35岁以前一定要形成个人风格

1、做人优于做事

做事失败可以重来,做人失败却不能重来

(1)做人要讲义气

(2)永不气馁

2、豁达的男人有财运,豁达的女人有帮夫运

35岁以前搞定婚姻生活

3、忠诚的原则:35岁以前你还没有建立起忠诚美誉,这一缺点将要困扰你的一生

4、把小事做细,但不要耍小聪明

中国人想做大事的人太多,而愿把小事做完美的人太少



第五章:五分运气

比尔.盖茨说:人生是不公平的,习惯去接受它吧

1、人生的确有很多运气的成人:谋事在人,成事在天:中国的古训说明各占一半

2、机会时常意外地降临,但属于那些不应决不放弃的人

3、抓住人生的每一次机会

机会就像一只小鸟,如果你不抓住,它就会飞得无影无踪

4、者早一步,愚者晚一步



第六章:六项要求

1、智慧

(1)别人可你以拿走你的一切,但拿不走你的智慧

(2)巧妙运用自己的智慧

(3)智者与愚者的区别

2、勇气

(1)勇气的力量有时会让你成为超人

(2)敢于放弃,敢于舍得

3、培养自己的领导才能、领袖气质

(1)激情感染别人

(2)三o七法则实现领袖气质

(3)拍板决断能力

(4)人格魅力

4、创造性:不要做循规蹈矩的人

25-35岁是人生最有创造性的阶段,很多成功人士也都产生在这一阶段

5、明智

(1)知道自己的长处、短处,定向聚焦

(2)尽量在自己的熟悉的领域努力

6、持之以恒的行动力:在你选定行业坚持十年

2007/6/13

好久没写博客了,也许都要废了

哈哈,主要是没什么可以写的