网络爬虫设计中需要注意的几个问题
做网络爬虫是件很有意义的事情。首先,它可以是一个专门的职业。从公司层面讲,业务和战略可能都需要很多数据进行多维度分析,所以现在很多公司都有专门的爬虫工程师负责设计数据采集系统;其次,很多公司以爬虫为生,爬虫就是他们用来赚取利润的最主要手段,...
做网络爬虫是件很有意义的事情。首先,它可以是一个专门的职业。从公司层面讲,业务和战略可能都需要很多数据进行多维度分析,所以现在很多公司都有专门的爬虫工程师负责设计数据采集系统;其次,很多公司以爬虫为生,爬虫就是他们用来赚取利润的最主要手段,...
前几天我在公众号发了一篇文章 『微信小程序 canvas 绘图问题总结』,截止到目前只有 9 人看过,说实话我有点心灰意冷。虽然我是半路出家,在这个行业里不认识什么人,没有人看很正常,因为看不懂嘛。可是心里还是很失落,陷入了自我否定的情绪,...
获取 IDEA 激活码、PyCharm 激活码、WebStorm 激活码和 DataGrip 激活码,提供详细破解教程与永久激活方法。支持 IDEA 永久激活与破解,免费获取注册码与激活码,解决 2024/2025 版本激活问题,轻松实现所有 JetBrains 工具的激活。
业务中碰到微信小程序需要生成海报进行朋友圈分享,这个是非常常见的功能,没想到实际操作的时候花了整整一天一夜才搞好,微信的 canvas 绘图实在是太难用了,官方快点优化一下吧。 业务非常简单,只需要将用到的图片,文案素材拼装到一张图片,保存...
阅读本文需要 2 分钟。 夏天天气非常热的时候整晚吹空调经常会吹得整个人都不舒服,早上起来很疲惫,达不到轻松睡眠的效果。空调吹久了还是会感觉到冷,定时功能不能完全满足需求,半夜醒来开了关,关了开实在是太折磨人了,于是决定自己做一个自动化的空...
前言 目前做直播项目,生产环境用的阿里云的ons-rocketmq,测试环境打算本地装一下rocketmq。 安装 看了下dockerhub的景象,还是4.3的版本,而官网已经4.7了。那就直接按照官网的安装方式,下载zip包,去linux...
前言 之前把k8s装起来了,但是没有装什么应用,只装了ingress-nginx和dashboard,看了下helm3之后决定用helm3装一下es 持久存储 因为创建的pod可以被销毁重建,临时存储的数据会丢失,而如果使用hostpath...
前言 我想玩玩k8s,但是我的云服务器是内网不互通的,装了好久,所以记录一下 安装docker yum update -y ##安装docker yum install -y docker ##更换成国内镜像 cat <<EOF...
前言 有个需求是对用户的name做模糊查询,数据大概2000万,mysql查询的太慢了,打算用es,导入数据就用了logstash,elk听说过,但是没用过,所以记录下 安装elk 之前写过装es的,但是看自己的去装居然失败了,看docke...
前言 我们有个老项目,以前用户量很大,现在没多少了,但是架构是以前的,aws的mongodb集群一个月的费用也不少,所以计划重构代码,我这边负责的是将mongodb的数据转到mysql,用过java写过转换程序,速度太慢,停服时间只有两个小...
前言 整了个微服务,老大说https跨域一直有问题,wtf?这个东西我都写过多少遍了,我感觉是他做的nginx跳转有问题,但是咱也不敢说啊,自己用nginx测一下呗。 部署 我采用的是compose的安装方式,服务器是百度云的 cd / m...