马拉松程序员

文章/答案/技术大牛

发布

LV1

发表了文章 2024-04-172024-04-17 15:41:33

从实践中理解Java的反射

话接上回，到新公司也有一个月了，慢慢开始接手和熟悉项目，也开始分配给我一些二次开发的内容。这也是大多数入职到新公司后，从熟悉到接手项目的常规流程。这个时候，你就...

马拉松程序员 2024-04-172024-04-17 15:41:33

java、对象、反射、开发、实践

发表了文章 2024-03-252024-03-25 13:09:44

梦回8年前，重启tomcat

最近好久没更新了，因为年后换了一份新工作，各方面还都需要适应下，不光是生活节奏，上下班时间，重要的是还有所做的项目。新公司是一个做自研B端产品的小公司，主要做面...

马拉松程序员 2024-03-252024-03-25 13:09:45

企业、工作、开发、框架、tomcat

发表了文章 2023-09-212023-09-21 19:02:57

数据分类：新闻信息自动分类

数据下载完成后，解压后的文件名news_sohusite_xml.smarty.dat（迷你版），文件编码是用的GBK。

马拉松程序员 2023-09-212023-09-21 19:02:57

path、测试、对象、模型、数据

发表了文章 2023-09-142023-09-14 08:15:24

数据分析：分类算法和评估

分类是在一群已经知道类型的样本中，训练一种分类器，让其能够对某种未知的样本进行分类。分类算法的分类过程就是建立一种分类模型来描述预定的数据集或概念集，通过分析由...

马拉松程序员 2023-09-142023-09-14 08:15:24

数据分析、分类算法、模型、数据、算法

发表了文章 2023-09-022023-09-02 08:07:17

数据分析：文本分类

本章节中所涉及的知识点偏向于机器学习的范畴，那么机器学习和数据分析有什么区别呢。简单来讲，数据分析是少量数据采样分析而机器学习是海量数据全部分析。比较好的理解一...

马拉松程序员 2023-09-022023-09-02 08:07:17

机器学习、数据分析、模型、数据、算法

发表了文章 2023-09-022023-09-02 08:07:02

数据清洗：文本规范化

前面章节初步学习数据的采集和一些快速的数据分析方法，如果需要更加深入去做数据分析，那么会使用到更加丰富的知识。自然语言处理（NLP）的其中一个方向就是文本处理。...

马拉松程序员 2023-09-022023-09-02 08:07:02

中文分词、规范化、模型、数据、数据清洗

发表了文章 2023-09-022023-09-02 08:06:46

数据获取:认识Scrapy

本节介绍一个普通流程的爬虫框架——Scrapy，它提供了一个通用性的开发规范，帮助开发者做好了通用性的功能，只需要自定义发几个模块就可以轻松的实现一个爬虫，用来...

马拉松程序员 2023-09-022023-09-02 08:06:46

爬虫、scrapy、对象、配置、数据

发表了文章 2023-09-022023-09-02 08:06:29

数据可视化：认识WordCloud

wordcloud是优秀的词云展示的第三方库，我们可以借助wordcloud轻松实现词云图。使用Wordcloud之前需要先了解它的以下几个特点：

马拉松程序员 2023-09-022023-09-02 08:06:29

爬虫、数据分析、数据可视化、对象、数据

发表了文章 2023-09-022023-09-02 08:06:10

数据可视化：认识Matplotlib

数据经过NumPy和Pandas的计算，最终得到了我们想要的数据结论，但是这些数据结论并不直观，所以想要把数据分析的结论做到可视化，让任何其他人看起来毫无压力，...

马拉松程序员 2023-09-022023-09-02 08:06:10

数据可视化、matplotlib、函数、可视化、数据

发表了文章 2023-09-022023-09-02 08:05:53

数据可视化：认识Pandas

Pandas是一个强大的分析结构化数据的工具集，它的使用基础是Numpy，用于数据挖掘和数据分析，同时也具有数据清洗功能。

马拉松程序员 2023-09-022023-09-02 08:05:53

数据可视化、pandas、对象、连接、数据

发表了文章 2023-09-022023-09-02 08:05:29

数据可视化：认识Numpy

NumPy是一个开源的Python数据分析和科学计算库，全称为“Numerical Python”，主要用于数组计算。NumPy是作为数据分析必备库之一，是从事...

马拉松程序员 2023-09-022023-09-02 08:05:29

numpy、数据可视化、数据、数据类型、数组

发表了文章 2023-09-022023-09-02 08:05:03

数据存储：MySql数据库的基本使用

数据库，顾名思义，就是存放数据的仓库，它是按照一定的数据结构来组织、存储和管理数据的仓库，是一个长期存储在计算机硬盘中、有组织的、可共享的、统一管理的大量数据的...

马拉松程序员 2023-09-022023-09-02 08:05:03

数据库、mysql、连接、数据、数据存储

发表了文章 2023-09-022023-09-02 08:04:45

数据存储：excel文件存放数据

前文中说到，数据分析就是像是做饭一样，在数据获取的内容好比收集食材，通常情况下，食材装备好后是需要有容器存放，有一些是需要立马做饭使用的，就放在盆中，还有一些今...

马拉松程序员 2023-09-022023-09-02 08:04:45

excel、对象、工作、数据、数据存储

发表了文章 2023-09-022023-09-02 08:04:24

数据获取：如何让爬虫更健壮

在昨天的demo中的代码还有一个问题就是，假如某个地方出错了怎么办，可能是网络掉线了，可能是某一次请求被拦截了，那么会造成程序直接停掉了。数据量小的爬虫还可以找...

马拉松程序员 2023-09-022023-09-02 08:04:24

爬虫、代理、数据、异常处理、字符串

发表了文章 2023-09-022023-09-02 08:04:05

数据获取：如何写一个基础爬虫

写好一个爬虫最基本的是做好页面分析，找到链接和规律，这样在写爬虫的时候就可以有方向和目的性。接下来，我们就以爬虫最常用的豆瓣评分TOP250的内容作为爬虫的de...

马拉松程序员 2023-09-022023-09-02 08:04:05

爬虫、class、对象、基础、数据

发表了文章 2023-09-022023-09-02 08:03:41

数据获取：网页解析之BeautifulSoup

Beautiful Soup也有很多版本，不过Beautiful Soup3已经停止更新了，目前最新的都是Beautiful Soup4，而且也已经移植到bs4...

马拉松程序员 2023-09-022023-09-02 08:03:41

beautifulsoup、遍历、对象、数据、搜索

发表了文章 2023-09-022023-09-02 08:03:21

数据获取：网页解析之lxml

lxml是Python的一个解析库，支持HTML和XML的解析，支持XPath（XML Path Language）解析方式。XPath，它是一门在XML文档中...

马拉松程序员 2023-09-022023-09-02 08:03:21

lxml、对象、浏览器、数据、语法

发表了文章 2023-09-022023-09-02 08:03:00

数据获取：认识HTML代码

一个网页通常是由HTML元素、CSS样式和JavaScript脚本组成，但是对于数据采集来说，有用的只有HTML元素。通俗一点讲，网页就是一个房子，html就是...

马拉松程序员 2023-09-022023-09-02 08:03:00

html、脚本、浏览器、数据、数据采集

发表了文章 2023-02-242023-02-24 18:50:58

数据获取：初识Requests

谈及到Python爬虫，必不可少的就是requests模块。前面内容中我们也讲到Python有丰富多彩的第三方模块，那么requests就是其中一个，reque...

马拉松程序员 2023-02-242023-02-24 18:50:58

html、json、网络安全、爬虫、python

发表了文章 2023-02-242023-02-24 18:50:37

数据获取：去菜市场采购还是自己去地里挖？

数据分析就是像是做饭一样，正所谓“巧妇难为无米之炊”。数据分析的前提就是数据的获取，只有把食材准备好，经过我们的加工，可以呈现出一道色香味俱全的美味菜肴。所以数...

马拉松程序员 2023-02-242023-02-24 18:50:37

爬虫、数据库、sql、网站、数据分析

12 3 4 5 下一页

个人简介

暂未填写公司和职称
会点Java和Python的程序员
暂未填写技能专长
暂未填写学校和专业
http://www.mlscoder.cn
上海
加入社区时间：2019-10-23

个人成就

获得 180 次赞同
文章被阅读 151.4K 次

关注了：1关注者：23