.NET (C#) 中,对网页进行加载后解析并生成截图或 PDF 文件,可以使用 PuppeteerSharp 或 PlaywrightSharp 库。本文主要介绍.Net中通过Puppeteer Sharp将网页加载解析后的内容,进行截图或生成pdf文件的方法代码。

1、html网页解析渲染后内容截图

await new BrowserFetcher().DownloadAsync(BrowserFetcher.DefaultRevision);
var browser = await Puppeteer.LaunchAsync(new LaunchOptions
{
Headless = true
});
var page = await browser.NewPageAsync();
await page.GoToAsync("http://www.google.com");
await page.ScreenshotAsync(outputFile);

生成截图前也可以改变ViewPort

await page.SetViewport(new ViewPortOptions
{
Width = 500,
Height = 500
});

2、html网页解析渲染后内容保存成pdf文件

await new BrowserFetcher().DownloadAsync(BrowserFetcher.DefaultRevision);
var browser = await Puppeteer.LaunchAsync(new LaunchOptions
{
Headless = true
});
var page = await browser.NewPageAsync();
await page.GoToAsync("http://www.google.com");
await page.PdfAsync(outputFile);

向网页中注入HTML、执行Javascript(js)代码、Selector等待加载完的内容,等更多操作和使用Puppeteer Sharp使用方法,参考下面的文档。

相关文档.NET(C#)中Puppeteer API的PuppeteerSharp的使用

推荐文档