11
2013
04

C# 读取网页所有源代码,存成字符串

        //第一个为读取网页或某个网页文件

        public static string WriteFile(string FilePath)
        {
            Encoding code = Encoding.GetEncoding("gb2312");
            //读取html和其他文件
            string temp = HttpContext.Current.Server.MapPath(FilePath);
            StreamReader sr = null;
            StreamWriter sw = null;
            string str = "";
            try
            {
                sr = new StreamReader(temp, code);
                str = sr.ReadToEnd(); // 读取文件   
            }
            catch (Exception exp)
            {
                sr.Close();
            }
            return str;
        }

        //按照网页编码读取网页源代码

        public static string GetWebClient(string url)
        {
            string strHTML = "";
            WebClient myWebClient = new WebClient();
            Stream myStream = myWebClient.OpenRead(url);
            StreamReader sr = new StreamReader(myStream, System.Text.Encoding.GetEncoding("utf-8"));
            strHTML = sr.ReadToEnd();
            myStream.Close();
            return strHTML;
        }

        //Request方式读取网页源代码

        public static string GetWebRequest(string url)
        {
            Uri uri = new Uri(url);
            WebRequest myReq = WebRequest.Create(uri);
            WebResponse result = myReq.GetResponse();
            Stream receviceStream = result.GetResponseStream();
            StreamReader readerOfStream = new StreamReader(receviceStream, System.Text.Encoding.GetEncoding("utf-8"));
            string strHTML = readerOfStream.ReadToEnd();
            readerOfStream.Close();
            receviceStream.Close();
            result.Close();
            return strHTML;
        }

« 上一篇下一篇 »

评论列表:

楼主好文,深有感悟,必须马克。我是一鸣,记得回访!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。