作者:AlbertWen
添加时间:2012-07-15 01:51:59
修改时间:2025-12-02 18:13:32
分类:
11.PHP基础
编辑
我用php ,curl主要是抓取数据,当然我们可以用其他的方法来抓取,比如fsockopen,file_get_contents等。但是只能抓那些能直接访问的页面,如果要抓取有页面访问控制的页面,或者是登录以后的页面就比较困难了。
1,抓取无访问控制文件
<?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "http://localhost/mytest/phpinfo.php");
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //如果把这行注释掉的话,就会直接输出
$result=curl_exec($ch);
curl_close($ch);
?>
2,使用代理进行抓取
作者:AlbertWen
添加时间:2012-07-15 01:29:19
修改时间:2025-10-29 08:53:15
分类:
12.PHP库/系统
编辑
作者:AlbertWen
添加时间:2012-07-13 23:06:37
修改时间:2025-12-09 10:48:29
分类:
11.PHP基础
编辑
CURL(Client URL Library Functions)是一个利用URL语法在命令行方式下工作的文件传输工具。它支持很多协议:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP。CURL同样支持HTTPS认证,HTTP POST方法, HTTP PUT方法,FTP 上传, kerberos认证,HTTP上传, 代理服务器, cookies, 用户名/密码认证,下载文件断点续传,上载文件断点续传, http代理服务器管道( proxy tunneling),甚至它还支持IPv6, socks5代理服务器, 通过http代理服务器上传文件到FTP服务器等等,功能十分强大。
作者:AlbertWen
添加时间:2012-05-24 22:04:14
修改时间:2025-11-10 15:54:44
分类:
03.MySQL/PgSQL/Redis
编辑
今天,数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显。关于数据库的性能,这并不只是DBA才需要担心的事,而这更是我 们程序员需要去关注的事情。当我们去设计数据库表结构,对操作数据库时(尤其是查表时的SQL语句),我们都需要注意数据操作的性能。这里,我们不会讲过多的SQL语句的优化,而只是针对MySQL这一Web应用最多的数据库。希望下面的这些优化技巧对你有用。
作者:AlbertWen
添加时间:2018-03-07 16:11:39
修改时间:2025-11-25 05:20:20
分类:
08.Java基础
编辑
poll 函数的返回值是一个整数,得到了这个返回值以后,我们还是要逐个去检查,比如说,有一万个socket同时poll,返回值是3,我们还是只能去遍历这一万个socket,看看它们是否有IO动作。这就很低效了,于是,就有了epoll的改进,epoll可以直接通过“输出参数”(可以理解为C语言中的指针类型的参数),一个 epoll_event 数组,直接获得这三个socket,这就比较快了。
作者:AlbertWen
添加时间:2012-07-12 21:08:00
修改时间:2025-12-08 11:55:37
分类:
11.PHP基础
编辑
Piwik是一套基于Php+能够与Google Analytics相媲美的开源网站访问统计系统,浏览人数, 访问最多的页面, 搜索引擎关键词等等,并且采用了大量的AJAX/Flash技术,使得在操作上更加便易。此外,它还采用了插件扩展及开放API架构,可以让开发人员根据 自已的实际需求创建更多的功能。
作者:AlbertWen
添加时间:2012-07-12 20:08:16
修改时间:2025-11-23 11:28:38
分类:
11.PHP基础
编辑
<?php
// 1. 初始化
$ch = curl_init();
// 2. 设置选项,包括URL
curl_setopt($ch, CURLOPT_URL, "");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
// 3. 执行并获取HTML文档内容
$output = curl_exec($ch);
// 4. 释放curl句柄
curl_close($ch);
?>
curl_setopt中的 CURLOPT_URL, CURLOPT_RETURNTRANSFER 等参数,请参考php文档手册,里面有详细说明!
现在得到$output内容…使用正则表达式匹配出你需要的内容。
作者:AlbertWen
添加时间:2012-07-12 19:52:01
修改时间:2025-11-21 22:47:09
分类:
11.PHP基础
编辑
PHP.ini 里有个 disable_functions 开关选项,此选项可关闭一些危险的函数,比如system,exec 等。比如: disable_functions = phpinfo , 如果在文件中调用 phpinfo() 函数,那么在 error_reporting 开启的情况下,会提示如下错误:
Warning: phpinfo() has been disabled for security reasons
屏蔽函数实例:
disable_functions= phpinfo,dl, exec, system
作者:AlbertWen
添加时间:2012-07-12 19:44:26
修改时间:2025-11-21 21:45:49
分类:
11.PHP基础
编辑
匹配特定数字:
^[1-9]\d*$ //匹配正整数
^-[1-9]\d*$ //匹配负整数
^-?[1-9]\d*$ //匹配整数
^[1-9]\d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正
作者:AlbertWen
添加时间:2012-07-10 23:41:52
修改时间:2025-12-03 10:13:22
分类:
06.Linux软件安装
编辑
在Macbook上做如下设置:
1.打开 “系统偏好设置(System Preferences)” -> “共享( Share)” 对话框,在左侧列表中的 “文件共享(File Sharing)” 之前打勾;
2.点击该对话框中的 “(选项)Options” 按钮;
3.在随后出线的对话框中的 “用FTP的方式共享文件夹(Share files and folders using FTP)” 之前打勾;