下面我将为你详细讲解有关“C#简单爬虫案例分享”的完整攻略。

1. 爬虫原理

爬虫是指程序自动化地访问互联网资源并提取信息。其基本原理是通过HTTP请求，获取服务器返回的HTML页面，并解析其中的内容进行采集、处理和格式化。通常，爬虫程序的实现过程可以分为以下几个步骤：

发送HTTP请求，并获取服务器返回的HTML页面。
解析HTML页面中的内容，识别其中的数据，并提取需要的信息。
将提取的内容进行分析、处理和存储等。

2. C#语言实现爬虫

对于C#语言来说，其实现爬虫程序的方式其实与其它编程语言类似，可以采用类似于Python的第三方库、也可以直接使用.NET框架中的类库。下面我将通过两个示例来讲解C#实现爬虫的具体方法。

2.1 示例1：使用HtmlAgilityPack库实现爬虫

HtmlAgilityPack是C#中的一款HTML解析类库，使用该库可以轻松地解析HTML页面，并获取其中的内容。接下来我将就HtmlAgilityPack使用方法，为你介绍如何使用这一库，实现相应的爬虫程序。

2.1.1 安装HtmlAgilityPack

在Visual Studio中，可以通过Nuget方式快速地安装HtmlAgilityPack库，方法如下：

右键点击“解决方案资源管理器”中项目选项，并选择“管理NuGet程序包”。
在打开的窗口中搜索“HtmlAgilityPack”，并进行安装即可。

2.1.2 编写C#爬虫程序

下面我将展示如何使用HtmlAgilityPack库编写C#爬虫程序。在本示例中，我们将以爬取“百度搜索结果”为例，为你讲解使用HtmlAgilityPack实现爬虫程序的方法。

引入HtmlAgilityPack库

using HtmlAgilityPack;

发送HTTP请求，并获取服务器返回的HTML页面

string url = "https://www.baidu.com/s?wd=.NET";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
request.Method = "GET";
request.Timeout = 5000;
WebResponse response = request.GetResponse();
Stream stream = response.GetResponseStream();
StreamReader reader = new StreamReader(stream, Encoding.UTF8);
string htmlContent = reader.ReadToEnd();

解析HTML页面中的内容，并提取需要的信息

HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.LoadHtml(htmlContent);
HtmlNodeCollection nodeCollection = htmlDoc.DocumentNode.SelectNodes("//div[contains(@class,'result')]");
foreach (HtmlNode node in nodeCollection) {
    string title = node.SelectSingleNode(".//h3/a").InnerText;
    string linkUrl = node.SelectSingleNode(".//h3/a[@href]").Attributes["href"].Value;
    Console.WriteLine("Title: {0}", title);
    Console.WriteLine("LinkUrl: {0}", linkUrl);
}

2.1.3 运行爬虫程序

接下来我们可以运行该爬虫程序，并查看其获取的搜索结果是否正确。

2.2 示例2：使用HttpClient类实现爬虫

HttpClient类是.NET框架中的一个HTTP请求类库，在使用该类库前，需要先安装Microsoft.AspNet.WebApi.Client程序包。

2.2.1 安装Microsoft.AspNet.WebApi.Client

在Visual Studio中，可以通过Nuget方式快速地安装Microsoft.AspNet.WebApi.Client库，方法如下：

右键点击“解决方案资源管理器”中项目选项，并选择“管理NuGet程序包”。
在打开的窗口中搜索“Microsoft.AspNet.WebApi.Client”，并进行安装即可。

2.2.2 编写C#爬虫程序

下面我将展示如何使用HttpClient类库编写C#爬虫程序。在本示例中，我们将以爬取“百度搜索结果”为例，为你讲解使用HttpClient实现爬虫程序的方法。

引入HttpClient库

using System.Net.Http;

发送HTTP请求，并获取服务器返回的HTML页面

using (HttpClient httpClient = new HttpClient()) {
    httpClient.Timeout = new TimeSpan(0, 0, 5);
    var response = httpClient.GetAsync("https://www.baidu.com/s?wd=.NET").Result;
    var htmlContent = response.Content.ReadAsStringAsync().Result;
}

解析HTML页面中的内容，并提取需要的信息

HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.LoadHtml(htmlContent);
HtmlNodeCollection nodeCollection = htmlDoc.DocumentNode.SelectNodes("//div[contains(@class,'result')]");
foreach (HtmlNode node in nodeCollection) {
    string title = node.SelectSingleNode(".//h3/a").InnerText;
    string linkUrl = node.SelectSingleNode(".//h3/a[@href]").Attributes["href"].Value;
    Console.WriteLine("Title: {0}", title);
    Console.WriteLine("LinkUrl: {0}", linkUrl);
}

2.2.3 运行爬虫程序