First version of Excel files union using ClosedXML library

This commit is contained in:
KharchenkoVV 2021-09-17 15:41:55 +05:00
parent 3616c90c65
commit 6c2e58a14d
2 changed files with 55 additions and 96 deletions

View File

@ -7,7 +7,7 @@
<ItemGroup>
<PackageReference Include="BenchmarkDotNet" Version="0.12.1" />
<PackageReference Include="DocumentFormat.OpenXml" Version="2.13.1" />
<PackageReference Include="ClosedXML" Version="0.95.4" />
<PackageReference Include="Mapster" Version="7.2.0" />
<PackageReference Include="Microsoft.AspNetCore.SignalR.Client" Version="5.0.5" />
<PackageReference Include="System.ComponentModel.Annotations" Version="5.0.0" />

View File

@ -1,11 +1,10 @@
using DocumentFormat.OpenXml;
using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Spreadsheet;
//using AsbSaubReport;
//using AsbSaubReport;
//using AutoMapper;
using System;
using System.IO;
using System.Collections.Generic;
using System.Linq;
using ClosedXML.Excel;
namespace ConsoleApp1
{
@ -17,127 +16,87 @@ namespace ConsoleApp1
class Program
{
private static void RemovePicturesFromSheet(IXLWorksheet sheet)
{
var picsNames = new List<string>();
foreach (var p in sheet.Pictures)
picsNames.Add(p.Name);
var filteredPics = picsNames.Distinct();
foreach (var n in filteredPics)
sheet.Pictures.Delete(n);
}
static void Main(/*string[] args*/)
{
var sourceExcelPaths = new List<string>
{
@"D:\excels\excel1.xlsx",
@"D:\excels\excel2.xlsx"
//@"D:\excels\excel1.xlsx",
//@"D:\excels\excel2.xlsx"
//@"D:\excels\e1.xlsx",
//@"D:\excels\e2.xlsx",
//@"D:\excels\e3.xlsx",
//@"D:\excels\e4.xlsx",
//@"D:\excels\e5.xlsx",
//@"D:\excels\e6.xlsx"
@"D:\excels\e4.XLSX",
@"D:\excels\e5.XLSX",
@"D:\excels\e6.XLSX"
};
const string resultExcelPath = @"D:\excels\result.xlsx";
// result file create and init
using (var resultExcelFile = SpreadsheetDocument.Create(resultExcelPath,
SpreadsheetDocumentType.Workbook, true))
using var resultExcelFile = new XLWorkbook();
const int maxAllowedColumns = 256;
foreach(var sourceExcelPath in sourceExcelPaths)
{
var workbookPart = resultExcelFile.AddWorkbookPart();
workbookPart.Workbook = new Workbook();
using var sourceExcelFile = new XLWorkbook(sourceExcelPath);
workbookPart.Workbook.AppendChild(new Sheets());
resultExcelFile.WorkbookPart.AddNewPart<SharedStringTablePart>();
resultExcelFile.WorkbookPart.SharedStringTablePart.SharedStringTable = new SharedStringTable();
resultExcelFile.WorkbookPart.AddNewPart<WorkbookStylesPart>();
workbookPart.Workbook.Save();
}
foreach (var sourceExcelPath in sourceExcelPaths)
foreach (var sheet in sourceExcelFile.Worksheets)
{
using var sourceExcelFile = SpreadsheetDocument.Open(sourceExcelPath, false);
//var columnsToDelete = sheet.Columns().Skip(sheet.ColumnsUsed().Count());
using var resultExcelFile = SpreadsheetDocument.Open(resultExcelPath, true);
//foreach (var d in columnsToDelete)
// d.Delete();
foreach (var sheet in sourceExcelFile.WorkbookPart.Workbook.Descendants<Sheet>())
if (sheet.Columns().Count() > maxAllowedColumns &&
sheet.Columns().Count() / sheet.ColumnsUsed().Count() > 5)
{
// Чтобы писать на новый лист, нужен новый WorkSheetPart, WorkSheet, SheetData и Sheet.
// https://stackoverflow.com/questions/9120544/openxml-multiple-sheets
Console.WriteLine($"В файле {Path.GetFileName(sourceExcelPath)} " +
$"{sheet.Columns().Count() - sheet.ColumnsUsed().Count()} пустых колонок " +
$"без записей. \n Если продолжить выполнение, форматирование выходного" +
$"листа может быть нарушено. \n Для сохранения структуры документа " +
$"рекомендуется прервать выполнение и удалить неиспользуемые колонки. \n" +
$" Продолжить выполнение? (y/n)");
var resultExcelWorkSheetPart = resultExcelFile.WorkbookPart.AddNewPart<WorksheetPart>();
resultExcelWorkSheetPart.Worksheet = new Worksheet();
var res = Console.ReadLine();
var resultExcelSheetData = resultExcelWorkSheetPart.
Worksheet.AppendChild(new SheetData());
if (res != "y")
return;
var newSheet = new Sheet()
{
Id = resultExcelFile.WorkbookPart.GetIdOfPart(resultExcelWorkSheetPart),
SheetId = sheet.SheetId.Value,
Name = sheet.Name
};
var firstTableCell = sheet.FirstCellUsed();
var lastTableCell = sheet.LastCellUsed();
var rngData = sheet.Range(firstTableCell.Address, lastTableCell.Address);
resultExcelFile.WorkbookPart.Workbook.Sheets.Append(newSheet);
RemovePicturesFromSheet(sheet);
var sourceWorkSheetPart = sourceExcelFile.WorkbookPart.
GetPartById(sheet.Id) as WorksheetPart;
var wsCopy = resultExcelFile.Worksheets.Add(sheet.Name);
wsCopy.Cell(1, 1).Value = rngData;
// Не самая лучшая выборка рядов текущей страницы исходного файла.
// Наверняка для этого есть метод.
var sourceFileCurrentListRows = sourceWorkSheetPart.Worksheet.ChildElements
.FirstOrDefault(w => w.LocalName == "sheetData").ChildElements;
// Числовые ячейки хранятся как есть и переносятся без проблем, а вот значения строковых ячеек хранятся
// в отдельной таблице. При этом в самой строковой ячейке хранится индекс этой строки в таблице
// (чтоб не хранить кучу одинаковых строк в документе. Что-то вроде интернирования строк).
// Тут как раз переносится клон этой таблицы из исходного файла в результирующий.
// Разные всяческие Part'ы можно найти тут:
// https://docs.microsoft.com/ru-ru/dotnet/api/documentformat.openxml.packaging.spreadsheetdocument.workbookpart?view=openxml-2.8.1
var sourceExcelStringTable = sourceExcelFile.WorkbookPart.GetPartsOfType<SharedStringTablePart>()
.FirstOrDefault().SharedStringTable;
//resultExcelFile.WorkbookPart.SharedStringTablePart.SharedStringTable.Load(sourceExcelFile.WorkbookPart.SharedStringTablePart);
//sourceExcelStringTable.CloneNode(true) as SharedStringTable;
// Аналогично переносим таблицу стилей ячеек (жирный шрифт и прочее).
// Иначе ячейки переносятся абсолютно обычными, без всякой стилизации.
var stylesSheet = sourceExcelFile.WorkbookPart.GetPartsOfType<WorkbookStylesPart>()
.FirstOrDefault().Stylesheet;
resultExcelFile.WorkbookPart.WorkbookStylesPart.Stylesheet =
stylesSheet.CloneNode(true) as Stylesheet;
// Клонируем ряды в новый файл (без клонирования они не вытаскиваются из общего дерева)
foreach (var row in sourceFileCurrentListRows)
{
var newCells = new List<Cell>();
foreach(var c in row.ChildElements)
{
var cell = (Cell)c;
if (cell.DataType is not null && cell.DataType.Value == CellValues.SharedString)
{
var cellValue = sourceExcelStringTable.ElementAt(int.Parse(cell.InnerText)).InnerText;
newCells.Add(new Cell {
CellReference = cell.CellReference,
DataType = CellValues.String,
CellValue = new CellValue(cellValue)
});
GC.Collect();
}
else
newCells.Add(cell.CloneNode(true) as Cell);
}
{
RemovePicturesFromSheet(sheet);
var newRow = row.CloneNode(true);
newRow.RemoveAllChildren();
newRow.Append(newCells);
resultExcelSheetData.AppendChild(newRow);
sheet.CopyTo(resultExcelFile, sheet.Name);
GC.Collect();
}
}
}
resultExcelFile.SaveAs(resultExcelPath);
Console.WriteLine("Done. Press any key to quit.");
Console.ReadKey();