博客统计信息

用户名:william_xu
文章数:36
评论数:17
访问量:9916
无忧币:204
博客积分:402
博客等级:3
注册日期:2011-09-26

我最近发表的评论

Nutch1.3集成Solr.. 回复
UI肯定要自己实现了,Solr自带的太..
使用正则表达式抽.. 回复
这个只是粗略的实现,思路并不是很..
使用Docx4j操作PP.. 回复
这个还是比较好用的,用到极致的话..
使用Docx4j操作PP.. 回复
处理Office2007文档的一个Java开源..
Nutch1.3集成Solr.. 回复
Nutch1.3集成Solr3.4网页快照功能实..
利用mmSeg4j分词实现网页文本倾向性分析
        最近一直在做网页情感倾向性分析的工作,找了一些论文,发现基于机器学习的算法在项目中不太合适,于是自己鼓捣了一套基于中文分词和正负面词库的分析算法。
       原理很简单:

       文章倾向性 =  ∑(出现的正面词汇 * 权重) —∑(出现的负面词汇 * 权重)。
 
       在这个基础上对于负面新闻再加上相关性判断。..
 ./mongod --fork --dbpath=/home/mongodb_data --logpath /home/mongodb_data/mongodb.log --logappend --replSet vismongo/192.168.90.27:27017,192.168.90.32:27017,192.168.90.34:27017
./mongod --fork --dbpath=/home/mongodb_data --logpath /home/mongodb_data/mongodb.log --logappend --replSet vismongo/192.168.90.27:27017,192.168.90.32:27017,192.168.90.29:27017



db.runCommand({"replSetInitiate":{
"_id":"vismongo",
"members":[
{"_id":1,"..
类别:NoSQL|阅读(16)|回复(0)|(0)阅读全文>>
 echo "/home/clusteruser/mongodb-linux-i686-2.0.4/bin/mongod --dbpath=/home/mongodb_data –logpath=/home/mongodb_data/mongodb.log –logappend  --auth –port=27017" >> /etc/rc.local
类别:NoSQL|阅读(26)|回复(0)|(0)阅读全文>>
 
 
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
/**
 * 分析时间戳
 * 
 * @author xum
 * 
 */
public class PublishTimeExtract {
 

private static final String TIME_REGEX = "((:|>|\\s)?20[0-9]{2}(-|/|\\.|\\u5e74)\\d{1,2}(-|/|\\.|\\u6708)\\d{1,2}(\\u65e5)?\\s?\\d{1,2}(:|\\u65f6)\\d{2}((:|\\u5206)\\d{2})?|(:..
2012-03-01 16:56:56
 今天遇到老领导,感觉受益匪浅,就创新产品生命周期整理个简单的图:
 

在由蓝海到红海过渡的过程中,不光要提升产品的质量,也要有意识的建立品牌,品牌效应尤为重要,在红海中生存,品牌会成为有力的武器之一。
 




package org.apache.nutch.parse.html;
import java.text.ParseException;

import java.text.SimpleDateFormat;

import java.util.Date;

import java.util.regex.Matcher;

import java.util.regex.Pattern;
/**

 * 分析时间戳

 *

 * @author xum

 *

 */

public class Publ..
 <?xml version="1.0" encoding="UTF-8" ?>
<!-- Licensed to the Apache Software Foundation (ASF) under one or more contributor 

license agreements. See the NOTICE file distributed with this work for additional 

information regarding copyright ownership. The ASF licenses this file to 

You under the Apache License, Version 2.0 (the "License"); you may not use 

this file except in compliance with the License. You may obtain a..
 使用Docx4j操作PPT指南系列(五)
                                                     —— 向PPT中插入表格
本章是系列中最后一部分内容,将会介绍如何向PPT中插入一个表格。表格操作可以说是Docx4j中最复杂的部分,由于数据、样式存在多变性,直接导致了表格很难使用XML Schema直接生成,当然如果想硬拼接XML字符串也可以,但会严重降低代码的可读性。因此,本章以使..
使用Docx4j操作PPT指南系列(四)
                                              —— 在PPT中插入图片
在上一章我们了解到如何在PPT中创建文本以及其他的图形元素,在本章将会介绍如何在PPT中插入一张图片,在这里要说一下,插入图片的操作相对比较简单,使用XML Schema的方式即..

http://tech.sina.com.cn/i/2012-02-02/08476676940.shtml
新浪科技讯 北京时间2月2日上午消息,Facebook今天启动IPO(首次公开招股),计划融资50亿美元。该公司创始人、CEO马克·扎克伯格发表公开信,点明Facebook的三大愿景和五大核心价值。
  以下为公开信全文:
  Facebook的创建目的并非成为一家公司。它的诞生,是为了践行一种社会使命:让世界更加开放,更加紧密相连。
  对于投资者而言,理解这一使命对于我们的意义,理解我们如何做出决定,以及我们为什么从事现在的工作,是一件非常重要的事情。我将在本文..
 <<   1   2   3   4   >>   页数 ( 1/4 )

订阅我的博客


google reader 鲜果 QQ邮箱 有道 抓虾