用C#写爬虫时候,比较实用的一项技巧。
/// <summary>
/// 格式化URL函数 urlX 传入相对URL objurl 传入绝对基URL 基URL 一定要带HTTP://
/// </summary>
/// <param name="urlX">传入单个的URL</param>
/// <param name="objurl">
/// 传入得到值的页面URL
/// </param>
/// <returns></returns>
public String FormAturl(String urlX, string objurl)
{
Uri baseUri = new Uri(objurl); // http://www.enet.com.cn/enews/inforcenter/designmore.jsp
Uri absoluteUri = new Uri(baseUri, urlX);//相对绝对路径都在这里转 这里的urlx ="../test.html"
return absoluteUri.ToString();// http://www.enet.com.cn/enews/test.html
}