First version of Excel files union using ClosedXML library

This commit is contained in:
KharchenkoVV 2021-09-17 15:41:55 +05:00
parent 3616c90c65
commit 6c2e58a14d
2 changed files with 55 additions and 96 deletions

View File

@ -7,7 +7,7 @@
<ItemGroup> <ItemGroup>
<PackageReference Include="BenchmarkDotNet" Version="0.12.1" /> <PackageReference Include="BenchmarkDotNet" Version="0.12.1" />
<PackageReference Include="DocumentFormat.OpenXml" Version="2.13.1" /> <PackageReference Include="ClosedXML" Version="0.95.4" />
<PackageReference Include="Mapster" Version="7.2.0" /> <PackageReference Include="Mapster" Version="7.2.0" />
<PackageReference Include="Microsoft.AspNetCore.SignalR.Client" Version="5.0.5" /> <PackageReference Include="Microsoft.AspNetCore.SignalR.Client" Version="5.0.5" />
<PackageReference Include="System.ComponentModel.Annotations" Version="5.0.0" /> <PackageReference Include="System.ComponentModel.Annotations" Version="5.0.0" />

View File

@ -1,11 +1,10 @@
using DocumentFormat.OpenXml; //using AsbSaubReport;
using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Spreadsheet;
//using AsbSaubReport;
//using AutoMapper; //using AutoMapper;
using System; using System;
using System.IO;
using System.Collections.Generic; using System.Collections.Generic;
using System.Linq; using System.Linq;
using ClosedXML.Excel;
namespace ConsoleApp1 namespace ConsoleApp1
{ {
@ -17,127 +16,87 @@ namespace ConsoleApp1
class Program class Program
{ {
private static void RemovePicturesFromSheet(IXLWorksheet sheet)
{
var picsNames = new List<string>();
foreach (var p in sheet.Pictures)
picsNames.Add(p.Name);
var filteredPics = picsNames.Distinct();
foreach (var n in filteredPics)
sheet.Pictures.Delete(n);
}
static void Main(/*string[] args*/) static void Main(/*string[] args*/)
{ {
var sourceExcelPaths = new List<string> var sourceExcelPaths = new List<string>
{ {
@"D:\excels\excel1.xlsx", //@"D:\excels\excel1.xlsx",
@"D:\excels\excel2.xlsx" //@"D:\excels\excel2.xlsx"
//@"D:\excels\e1.xlsx", //@"D:\excels\e1.xlsx",
//@"D:\excels\e2.xlsx", //@"D:\excels\e2.xlsx",
//@"D:\excels\e3.xlsx", //@"D:\excels\e3.xlsx",
//@"D:\excels\e4.xlsx", @"D:\excels\e4.XLSX",
//@"D:\excels\e5.xlsx", @"D:\excels\e5.XLSX",
//@"D:\excels\e6.xlsx" @"D:\excels\e6.XLSX"
}; };
const string resultExcelPath = @"D:\excels\result.xlsx"; const string resultExcelPath = @"D:\excels\result.xlsx";
// result file create and init using var resultExcelFile = new XLWorkbook();
using (var resultExcelFile = SpreadsheetDocument.Create(resultExcelPath,
SpreadsheetDocumentType.Workbook, true)) const int maxAllowedColumns = 256;
foreach(var sourceExcelPath in sourceExcelPaths)
{ {
var workbookPart = resultExcelFile.AddWorkbookPart(); using var sourceExcelFile = new XLWorkbook(sourceExcelPath);
workbookPart.Workbook = new Workbook();
workbookPart.Workbook.AppendChild(new Sheets()); foreach (var sheet in sourceExcelFile.Worksheets)
resultExcelFile.WorkbookPart.AddNewPart<SharedStringTablePart>();
resultExcelFile.WorkbookPart.SharedStringTablePart.SharedStringTable = new SharedStringTable();
resultExcelFile.WorkbookPart.AddNewPart<WorkbookStylesPart>();
workbookPart.Workbook.Save();
}
foreach (var sourceExcelPath in sourceExcelPaths)
{
using var sourceExcelFile = SpreadsheetDocument.Open(sourceExcelPath, false);
using var resultExcelFile = SpreadsheetDocument.Open(resultExcelPath, true);
foreach (var sheet in sourceExcelFile.WorkbookPart.Workbook.Descendants<Sheet>())
{ {
// Чтобы писать на новый лист, нужен новый WorkSheetPart, WorkSheet, SheetData и Sheet. //var columnsToDelete = sheet.Columns().Skip(sheet.ColumnsUsed().Count());
// https://stackoverflow.com/questions/9120544/openxml-multiple-sheets
var resultExcelWorkSheetPart = resultExcelFile.WorkbookPart.AddNewPart<WorksheetPart>(); //foreach (var d in columnsToDelete)
resultExcelWorkSheetPart.Worksheet = new Worksheet(); // d.Delete();
var resultExcelSheetData = resultExcelWorkSheetPart. if (sheet.Columns().Count() > maxAllowedColumns &&
Worksheet.AppendChild(new SheetData()); sheet.Columns().Count() / sheet.ColumnsUsed().Count() > 5)
var newSheet = new Sheet()
{ {
Id = resultExcelFile.WorkbookPart.GetIdOfPart(resultExcelWorkSheetPart), Console.WriteLine($"В файле {Path.GetFileName(sourceExcelPath)} " +
SheetId = sheet.SheetId.Value, $"{sheet.Columns().Count() - sheet.ColumnsUsed().Count()} пустых колонок " +
Name = sheet.Name $"без записей. \n Если продолжить выполнение, форматирование выходного" +
}; $"листа может быть нарушено. \n Для сохранения структуры документа " +
$"рекомендуется прервать выполнение и удалить неиспользуемые колонки. \n" +
$" Продолжить выполнение? (y/n)");
resultExcelFile.WorkbookPart.Workbook.Sheets.Append(newSheet); var res = Console.ReadLine();
var sourceWorkSheetPart = sourceExcelFile.WorkbookPart. if (res != "y")
GetPartById(sheet.Id) as WorksheetPart; return;
// Не самая лучшая выборка рядов текущей страницы исходного файла. var firstTableCell = sheet.FirstCellUsed();
// Наверняка для этого есть метод. var lastTableCell = sheet.LastCellUsed();
var sourceFileCurrentListRows = sourceWorkSheetPart.Worksheet.ChildElements var rngData = sheet.Range(firstTableCell.Address, lastTableCell.Address);
.FirstOrDefault(w => w.LocalName == "sheetData").ChildElements;
// Числовые ячейки хранятся как есть и переносятся без проблем, а вот значения строковых ячеек хранятся RemovePicturesFromSheet(sheet);
// в отдельной таблице. При этом в самой строковой ячейке хранится индекс этой строки в таблице
// (чтоб не хранить кучу одинаковых строк в документе. Что-то вроде интернирования строк).
// Тут как раз переносится клон этой таблицы из исходного файла в результирующий.
// Разные всяческие Part'ы можно найти тут:
// https://docs.microsoft.com/ru-ru/dotnet/api/documentformat.openxml.packaging.spreadsheetdocument.workbookpart?view=openxml-2.8.1
var sourceExcelStringTable = sourceExcelFile.WorkbookPart.GetPartsOfType<SharedStringTablePart>() var wsCopy = resultExcelFile.Worksheets.Add(sheet.Name);
.FirstOrDefault().SharedStringTable; wsCopy.Cell(1, 1).Value = rngData;
//resultExcelFile.WorkbookPart.SharedStringTablePart.SharedStringTable.Load(sourceExcelFile.WorkbookPart.SharedStringTablePart); GC.Collect();
//sourceExcelStringTable.CloneNode(true) as SharedStringTable; }
else
// Аналогично переносим таблицу стилей ячеек (жирный шрифт и прочее).
// Иначе ячейки переносятся абсолютно обычными, без всякой стилизации.
var stylesSheet = sourceExcelFile.WorkbookPart.GetPartsOfType<WorkbookStylesPart>()
.FirstOrDefault().Stylesheet;
resultExcelFile.WorkbookPart.WorkbookStylesPart.Stylesheet =
stylesSheet.CloneNode(true) as Stylesheet;
// Клонируем ряды в новый файл (без клонирования они не вытаскиваются из общего дерева)
foreach (var row in sourceFileCurrentListRows)
{ {
var newCells = new List<Cell>(); RemovePicturesFromSheet(sheet);
foreach(var c in row.ChildElements) sheet.CopyTo(resultExcelFile, sheet.Name);
{ GC.Collect();
var cell = (Cell)c;
if (cell.DataType is not null && cell.DataType.Value == CellValues.SharedString)
{
var cellValue = sourceExcelStringTable.ElementAt(int.Parse(cell.InnerText)).InnerText;
newCells.Add(new Cell {
CellReference = cell.CellReference,
DataType = CellValues.String,
CellValue = new CellValue(cellValue)
});
}
else
newCells.Add(cell.CloneNode(true) as Cell);
}
var newRow = row.CloneNode(true);
newRow.RemoveAllChildren();
newRow.Append(newCells);
resultExcelSheetData.AppendChild(newRow);
} }
} }
} }
resultExcelFile.SaveAs(resultExcelPath);
Console.WriteLine("Done. Press any key to quit."); Console.WriteLine("Done. Press any key to quit.");
Console.ReadKey(); Console.ReadKey();