首页
学习
活动
专区
工具
TVP
发布

技术一点点成长

专栏成员
88
文章
49266
阅读量
15
订阅数
定制化JDK升级引发的离奇事件
1、背景 由于Oracle对外宣称Oracle JDK停止免费用于商用。公司法务部门评估之后担心后续会惹上光司,于是就开始了JDK升级-将所有服务Oracle修改为OpenJDK。上周开始微服务JD
云海谷天
2022-09-23
3530
红黑树-想说爱你不容易
  记得在大一懵懵懂懂的时候就接触了红黑树的算法。但由于当时内功尚浅,无法将其内化,只是觉得它很神奇,是个好算法,设计它的人很牛!现今重拾起这个算法,不得不再次被它的精妙所折服!编写本文,是希望以鄙人的理解将红黑树算法的精髓向博客园的园友陈述一番,也希望对其有独特见解的朋友能不吝赐教。准备好了的话,我们就开始吧~
云海谷天
2022-08-09
2620
互动百科词条快速抓取[适用于文本处理与挖掘]
因近期小组的一个项目有文本挖掘的需求,需要用到Word2Vec的文本特征抽取,为了进行技术预演需要我们提前对模型进行训练。而只要涉及数据挖掘相关的模型,数据集是不必可少的。中文文本挖掘领域,百科词条涵盖面广,而且内容比较丰富,于是便选择百科的词条作为数据集 (http://baike.com)。
云海谷天
2022-08-09
7981
Shell如何解决文件流管道的文本拼接失效问题
  近期由于业务的需要,需实现通过监控日志文件的内容并定时将日志的有效内容通过邮件进行告警。  
云海谷天
2022-08-09
5500
Redis高可用升级
  缓存对应实时性要求比较高的业务需求可谓十分重要,但缓存中的实时数据一旦丢失,将直接影响整个业务功能。考虑到各场景的业务需求,redis推出了高可用的方案,即:主从+哨兵的HA机制。  
云海谷天
2022-08-09
3840
Hive集成HBase实践
#step1: create hive table 't_test' hive -e " create table test.t_user(id int,name string,age int) row format delimited fields terminated by '\t'; "
云海谷天
2022-08-09
3450
Java8常用新特性实践
  时下Oracle开速迭代的Java社区以即将推出Java10,但尴尬的是不少小中企业仍使用JDK7甚至JDK6开发。
云海谷天
2022-08-09
1870
Presto集群部署
  随着大数据的普及,大部分企业的大数据查询与统计渐渐出现瓶颈。虽说存储方面有分布式的HDFS,HBSE,MongoDB等可以应对,但是面对千万级别(1x10^7)界别的数据量查询时,以上组件也不免显得力不从心。正因此,分布式查询引擎应运而生。而基于内存查询的分布式查询引擎--Presto正是其中之一。很多人都说现代计算机技术的发展都是拼开源,拼社区。而Presto的社区也不小,国际化的Facebook,也有国内电商大头京东。正因此,在经过实际尝试与测验之后决定简要地介绍一下presto的部署方式,希望能给有需要的朋友提供一些参考。
云海谷天
2022-08-09
1.3K0
Exception: Unexpected End Of File(crontab)
1 * * * * source /etc/profile && sh ~/tools/get_free_m.sh >> ~/tools/`date +%Y-%m-%d`.log
云海谷天
2022-08-09
2200
centos6环境下使用yum安装Ambari
  Ambari是apache下面的开源项目,主要通过web UI方式对Hadoop集群进行统一创建和管理,以节省Hadoop集群的运维成本。本文通过安装过程中的截图简要介绍一下相关步骤供需要的朋友参考。
云海谷天
2022-08-09
3310
pyspark进行词频统计并返回topN
Part I:词频统计并返回topN 统计的文本数据: what do you do how do you do how do you do how are you from operator import add from pyspark import SparkContext def sort_t(): sc = SparkContext(appName="testWC") data = sc.parallelize(["what do you do", "how do you d
云海谷天
2022-08-09
5740
七行代码开始flask
  对于现有的企业接口服务实现方式来说,Java比较适用于大型的并发式的业务场景;而对一些低IO的且功能简单的数据接口来说,Python似乎更合适。近几年流行的Flask可以说是专为接口式开发而生。如果你想使用python进行快捷式接口开发,那么下面的一个简单的入门实例或许可以让你快速着手开发(大牛们请绕路)。
云海谷天
2022-08-09
2140
Windows环境部署并调试pyspark(一)
windows环境说明:Python2.7 + pip spark版本:spark-1.6.1-bin-hadoop2.6
云海谷天
2022-08-09
4510
Python当前文件路径与文件夹删除操作
  Python的文件操作跟Java存在部分差异。由于项目需要,近期使用python进行模块开发时遇到一些常见的文件操作便上网搜罗了一番,感觉众说纷纭。因此,结合自身的使用场景,贴一段python代码供后续查阅。
云海谷天
2022-08-09
1.3K0
centos6快速搭建nginx
[nginx] name=nginx repo baseurl=http://nginx.org/packages/OS/OSRELEASE/$basearch/ gpgcheck=0 enabled=1
云海谷天
2022-08-09
3600
Django入门实战【3步曲】
junhongdeMacBook-Air:site-packages junhongchen$ python -V
云海谷天
2022-08-09
1700
HDFS Java Client对hdfs文件增删查改
<!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-common -->
云海谷天
2022-08-09
4600
百度开源e-chart初探
  近年来,在数据服务的公司中,数据可视化越来越重要。随着而来的,国内外正在如火如荼的开发各种在线js视图展示框架。而百度的e-chart算是实用性较高且体验最好的!今天闲来无事,便来玩玩~
云海谷天
2022-08-09
1.2K0
由于java.util.Arrays.asList(...)导致的异常
   Collections.toArray()与Arrays.asList() 是Java API提供的友好的相互转换工具,日常开发中用于列表和数组之间的转换非常方便,但今天测试时,发现一下隐藏的坑。。。
云海谷天
2022-08-09
2260
Mongodb增加权限管理
  随着列式存储理念的成熟,越来越多的开发者开始接纳mongodb,hbase这类大储存的分布式列式数据库。特别是mongodb的这种快速搭建,快速使用特点,使其得到更多人的青睐。本人主要通过官网说明针对mongodb权限配置做一个测试与实践。
云海谷天
2022-08-09
4390
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档