这也就解释了被打断三次后的崩溃了,找到问题的根源了,想办法如何解决吧!
最容易想到的解决办法是手动复制文章列表数据,然后程序分析提取关键数据,最后再统计数据....梳理操作流程
因此,现在先着手如何将复制后的文章列表转化成程序能够处理的文件格式,进而调用程序统计.
下面以慕课网手记文章为例,简单介绍下处理流程.
手动复制文章
?...这里需要 excel 这种格式文档,但是 excel 比较笨重,还需要相关软件才能打开 excel 文件,好像并不是很适合,怎么办呢?
但是我真的需要这种一行一行的数据格式啊,有没有折中的处理方案?...轻量级的 csv 格式不是巧合适合简单文档处理吗?
csv 和 excel 具有类似的特征,大体上都是一行一行一列一列地存储数据,最适合统计数据了....果然有 csv 相关工具类,下面就开始研究如何调用吧!
集成 commons-csv 工具类
<!