1 | //声明和需进行跨线程调用的方法相同形参表的委托 |
一木禾网盘文件下载地址批量获取实现
流程清晰之后,我们就可以制作软件来对网盘地址链接批量处理得到下载链接。
Rtmp/Hls直播、点播服务器部署与配置
redhat7.3配置163 yum源
redhat 的更新包只对注册的用户生效,所以我们需要自己手动更改成CentOS 的更新包,CentOS几乎和redhat是一样的,所以无需担心软件包是否可安装,安装之后是否有问题。
MVC学习笔记索引帖
C#读取CPU序列号、硬盘ID、网卡MAC地址,生成机器码
话不多说,直接上代码,类库中的机器码使用序列号、硬盘ID、网卡MAC地址组合取MD5生成。
C#线性筛法快速求出范围内的所有质数
质数是指在大于1的自然数中,除了1和它本身以外不再有其他因数的数。本文列举了几种求区间内所有质数的算法。
C# TextBox Ctrl+A全选
Winform程序中光标在TextBox控件中时按下 Ctrl + A 快捷键,并不能选中全部文字,而是会发出警告音。本文给出实现方法。
【爬虫学习笔记】用于提取网页中所有链接的 Extractor 模块
Extractor的工作是从下载的网页中将它包含的所有URL提取出来。这是个细致的工作,你需要考虑到所有可能的url的样式,比如网页中常常会包含相对路径的url,提取的时候需要将它转换成绝对路径。这里我们选择使用正则表达式来完成链接的提取。
html标签中的链接地址通常会出现在href属性或者src属性中,所以我们采用两个正则表达式来匹配网页中的所有链接地址。
【爬虫学习笔记】基于Bloom Filter的url去重模块UrlSeen
Url Seen用来做url去重。对于一个大的爬虫系统,它可能已经有百亿或者千亿的url,新来一个url如何能快速的判断url是否已经出现过非常关键。因为大的爬虫系统可能一秒钟就会下载几千个网页,一个网页一般能够抽取出几十个url,而每个url都需要执行去重操作,可想每秒需要执行大量的去重操作。因此Url Seen是整个爬虫系统中非常有技术含量的一个部分。