本来我是抱着打酱油的态度去的,但是却收获不少,所谓无心插柳柳成荫。印象很深的几条写下来和大家分享一下
- 尽责:如何才算尽责,永远站在比你高的上司的角度来思考你的职责,这样才能取得上级信任
- 积极的态度:事情总是有两面性,一味地愤青或者关注自己改变不了的事实,会更苦闷,要去观察阳光的一面
- 首问:对负责甚至过问的事情,总是要确定是否完成
- 确认回复,开完会list自己的责任,向上司确认,收到上司的领导需要回复收到,ok,等等
- 选择一条路的时候,不要去羡慕别人的风景
#include #include class A{ public:A{…} ~A{…} } class B{ public:B{…} ~B{…} } class D{ public:D{…} ~D{…} } class E{ public:E{…} ~E{…} } class C :public A,public B{ public:C{…} private:D objD_; E objE_; ~C{…} } int main(void){ C test; return 0; } |
A{…}//派生表中的顺序 B{…} D{…}//成员类的构造函数优先被调用 E{…} C{…} ~C{…} ~E{…} ~D{…} ~B{…} ~A{…} |
#include #include class A{ public:A{…} ~A{…} } class B{ public:B{…} ~B{…} } class D{ public:D{…} ~D{…} } class E{ public:E{…} ~E{…} } class C :public A,public B{ public:C{…} private:D objD_; E objE_; ~C{…} } int main(void){ C test; return 0; } |
A{…}//派生表中的顺序 B{…} D{…}//成员类的构造函数优先被调用 E{…} C{…} ~C{…} ~E{…} ~D{…} ~B{…} ~A{…} |
转自我的javaeye blog:http://xusulong.javaeye.com/blog/663411
前些日子琢磨着想搭建一个搜索引擎,自己写成本有点高,虽然以前写过爬虫,但是索引排序估计要烦得多
nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。是一个应用程序,可以以 Lucene 为基础实现搜索引擎应用。
选定nutch之后,开始着手学习使用nutch,英文水平还不够,只能看看nutch的简单的tutorial,但是真正当教程,我还是选择了中 文,可以让第一个搜索跑起来之后再选择学习英文的文档,以便更深的理解。
我选择的教程是 nutch入门学习
我的系统是Ubuntu 9.10,java -version 1.6.0_20-b02,nutch 1.0,以及tomcat 6.0.26
这里参考nutch入门 学习 ,我把改的地方说明出来。
<property> <name>http.agent.name</name> <value></value> <description>HTTP 'User-Agent' request header. MUST NOT be empty - please set this to a single word uniquely related to your organization. NOTE: You should also check other related properties: http.robots.agents http.agent.description http.agent.url http.agent.email http.agent.version and set their values appropriately. </description> </property> <property> <name>http.agent.description</name> <value></value> <description>Further description of our bot- this text is used in the User-Agent header. It appears in parenthesis after the agent name. </description> </property> <property> <name>http.agent.url</name> <value></value> <description>A URL to advertise in the User-Agent header. This will appear in parenthesis after the agent name. Custom dictates that this should be a URL of a page explaining the purpose and behavior of this crawler. </description> </property> <property> <name>http.agent.email</name> <value></value> <description>An email address to advertise in the HTTP 'From' request header and User-Agent header. A good practice is to mangle this address (e.g. 'info at example dot com') to avoid spamming. </description>nutch入门 学习 中说这里就算是不修改也无所谓,这里的设置,是因为nutch遵守了robots协议,在获取response时,把自己的相关信息提交给被爬行的网站, 以供识别。但是我这样设置出现了错误提示,即http.agent.name需要设置,我将value设置成 xusulong*(记住有*)即可。其他可以不设置了。
<configuration> <property> <name>searcher.dir</name> <value>/home/whu/nutch/crawl.demo</value> </property> </configuration>这里的/home/whu/nutch/crawl.demo是我的nutch路径,爬虫到时候的数据就会放在程序新建的crawl.demo下面,即 nutch抓取的页面的保存目录。
whu@leopard:~/nutch$ bin/nutch crawl urls -dir crawl.demo -depth 2 -threads 4 -topN 5 >& crawl.log
具体的参数nutch入门 学习 有解释,也可以参见nutch的官方网站。这里只抓取少量站点。
这时候 crawl.log会记录抓取的信息,我中间遇到过
如下几个错误:
运行tomcat,进入首页,搜索网易,结果如下:
搞了一个下午和晚上,泪流满面,中途还有其他的错误我记不大清楚了,总之严重的错误我列出来了,仔细看系统如何报错,google之,仔细发现错误 才是王道。
转自我的javaeye blog:http://xusulong.javaeye.com/blog/663411
前些日子琢磨着想搭建一个搜索引擎,自己写成本有点高,虽然以前写过爬虫,但是索引排序估计要烦得多
nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。是一个应用程序,可以以 Lucene 为基础实现搜索引擎应用。
选定nutch之后,开始着手学习使用nutch,英文水平还不够,只能看看nutch的简单的tutorial,但是真正当教程,我还是选择了中 文,可以让第一个搜索跑起来之后再选择学习英文的文档,以便更深的理解。
我选择的教程是 nutch入门学习
我的系统是Ubuntu 9.10,java -version 1.6.0_20-b02,nutch 1.0,以及tomcat 6.0.26
这里参考nutch入门 学习 ,我把改的地方说明出来。
<property> <name>http.agent.name</name> <value></value> <description>HTTP 'User-Agent' request header. MUST NOT be empty - please set this to a single word uniquely related to your organization. NOTE: You should also check other related properties: http.robots.agents http.agent.description http.agent.url http.agent.email http.agent.version and set their values appropriately. </description> </property> <property> <name>http.agent.description</name> <value></value> <description>Further description of our bot- this text is used in the User-Agent header. It appears in parenthesis after the agent name. </description> </property> <property> <name>http.agent.url</name> <value></value> <description>A URL to advertise in the User-Agent header. This will appear in parenthesis after the agent name. Custom dictates that this should be a URL of a page explaining the purpose and behavior of this crawler. </description> </property> <property> <name>http.agent.email</name> <value></value> <description>An email address to advertise in the HTTP 'From' request header and User-Agent header. A good practice is to mangle this address (e.g. 'info at example dot com') to avoid spamming. </description>nutch入门 学习 中说这里就算是不修改也无所谓,这里的设置,是因为nutch遵守了robots协议,在获取response时,把自己的相关信息提交给被爬行的网站, 以供识别。但是我这样设置出现了错误提示,即http.agent.name需要设置,我将value设置成 xusulong*(记住有*)即可。其他可以不设置了。
<configuration> <property> <name>searcher.dir</name> <value>/home/whu/nutch/crawl.demo</value> </property> </configuration>这里的/home/whu/nutch/crawl.demo是我的nutch路径,爬虫到时候的数据就会放在程序新建的crawl.demo下面,即 nutch抓取的页面的保存目录。
whu@leopard:~/nutch$ bin/nutch crawl urls -dir crawl.demo -depth 2 -threads 4 -topN 5 >& crawl.log
具体的参数nutch入门 学习 有解释,也可以参见nutch的官方网站。这里只抓取少量站点。
这时候 crawl.log会记录抓取的信息,我中间遇到过
如下几个错误:
运行tomcat,进入首页,搜索网易,结果如下:
搞了一个下午和晚上,泪流满面,中途还有其他的错误我记不大清楚了,总之严重的错误我列出来了,仔细看系统如何报错,google之,仔细发现错误 才是王道。
我许是空虚、寂寞、 无聊的蛋疼了,居然在好友屡次劝说万万不能看的情况下,依然抱着对小徐同学的一点一点的幻想而义无反顾地冲了上去。
然而事实证明我输了, 输得很彻底。
小徐同学是不是不会穿衣裳了,我感觉她换的n件衣服,有 >=70% 穿起来太俗气,尤其是她穿了粗粗的裤子,不是剧组在淘宝淘的吧。然后是黄立行,我灰常纳闷,这哥们一是没有长相,而是更没有演技,怎么就让这种人来充当男 猪脚,王朔都比他好。
再说说对白,英文就英文,中文就中文,他偏要插在一起说,说就说吧,中文咬字又要不清楚,英文我不能评价,不过估计 也就那样,看得我揪心。
差点忘了广告了,开场就一个兴业银行,差点把我雷倒,不过这还是小儿科,接着各种nokia,各种德芙,各种 XXX,最要命的是马自达的跑车,来过全方位的特写。不得不感叹杜拉拉这则广告拍得太长了,都tmd赶上电影了。
谨记:国产电影不是一般 人都能看的
我许是空虚、寂寞、 无聊的蛋疼了,居然在好友屡次劝说万万不能看的情况下,依然抱着对小徐同学的一点一点的幻想而义无反顾地冲了上去。
然而事实证明我输了, 输得很彻底。
小徐同学是不是不会穿衣裳了,我感觉她换的n件衣服,有 >=70% 穿起来太俗气,尤其是她穿了粗粗的裤子,不是剧组在淘宝淘的吧。然后是黄立行,我灰常纳闷,这哥们一是没有长相,而是更没有演技,怎么就让这种人来充当男 猪脚,王朔都比他好。
再说说对白,英文就英文,中文就中文,他偏要插在一起说,说就说吧,中文咬字又要不清楚,英文我不能评价,不过估计 也就那样,看得我揪心。
差点忘了广告了,开场就一个兴业银行,差点把我雷倒,不过这还是小儿科,接着各种nokia,各种德芙,各种 XXX,最要命的是马自达的跑车,来过全方位的特写。不得不感叹杜拉拉这则广告拍得太长了,都tmd赶上电影了。
谨记:国产电影不是一般 人都能看的