.NET Core(C#) 使用AngleSharp生成自动缩进格式化的html方法

本文主要介绍.NET Core(C#)中,使用AngleSharp生成自动缩进格式化的html代码方法,和下载获取网页html代码的方法,以及相关的示例代码。

1、项目中安装引用AngleSharp

AngleSharphttp://anglesharp.github.io/

通过NuGet获取AngleSharp

1)使用Nuget管理控制台

将AngleSharp集成到项目中的最简单方法是使用NuGet。您可以通过打开包管理器控制台(PM)并键入以下语句来安装AngleSharp:

Install-Package AngleSharp

2)使用Nuget图形管理器

使用Nuget的界面的管理器搜索"AngleSharp"=> 找到点出点击"安装"

3)使用.NET CLI命令安装

> dotnet add TodoApi.csproj package AngleSharp

相关文档VS(Visual Studio)中Nuget的使用

2、使用AngleSharp生成html代码自动缩进格式化

var parser = new HtmlParser();
var document = parser.ParseDocument(text);
using (var writer = new StringWriter())
{
    document.ToHtml(writer, new PrettyMarkupFormatter
                            {
                                Indentation = "\t",
                                NewLine = "\n"
                            });
    var indentedText = writer.ToString();
}

3、使用AngleSharp下载获取html代码

var requester = new DefaultHttpRequester("Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36");
           //https://www.cjavapy.com/article/696/
            requester.Headers.Add("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8");
            requester.Headers.Add("Referer", "");
            requester.Headers.Add("Accept-Language", "zh-Hans-CN,zh-Hans;q=0.8,en-US;q=0.5,en;q=0.3");
            var context = BrowsingContext.New(Configuration.Default.WithLocaleBasedEncoding().WithDefaultLoader().WithDefaultCookies().With(requester));
            //根据虚拟请求/响应模式创建文档
            //https://www.cjavapy.com/article/696/
            var document = context.OpenAsync(url).Result;
using (var writer = new StringWriter())
{
    document.ToHtml(writer, new PrettyMarkupFormatter
                            {
                                Indentation = "\t",
                                NewLine = "\n"
                            });
    var indentedText = writer.ToString();
}

相关文档:

.NET Core(C#)使用AngleSharp下载网页源码及资源文件(html,css,js,jpg等图片)

.NET Core(C#) AngleSharp 解析百度和谷歌搜索结果html(链接、标题、描述)

.Net(C#) Core安装使用anglesharp解析html的方法及示例代码

推荐阅读
cjavapy编程之路首页