C # extrae texto formateado de Excel a través de OLEDB

Estoy leyendo datos de un archivo de excel grande que tiene textos con formato. oleDBConnection los datos al objeto DataTable través de oleDBConnection & GetOleDbSchemaTable . Pero los datos extraídos no incluyen ninguna información formateada.

Mi requisito es que necesito extraer solo textos que no sean tachados.

No tengo ningún problema al leer y todo está perfectamente bien. Pero mi extracción debe basarse en el formato de texto en excel en el que no puedo encontrar la solución.

Cualquier cosa que se agregue en el connectionString que es como sigue:

 connectionString = "Provider=Microsoft.ACE.OLEDB.12.0;Data Source=" + fileName + "; Extended Properties=\"Excel 12.0 Xml;HDR=YES;Mode=Read;ReadOnly=True;\""; 

Restricciones:

  1. Usando OleDBConnection – Sin Interoperabilidad

  2. Leyendo al objeto DataTable

Que yo sepa, no puede hacer esto solo con el controlador ACE. Dicho esto, si alguna vez se eliminan las restricciones, esta es la herramienta que se debe utilizar: http://closedxml.codeplex.com/

Debe cambiar su enfoque para utilizar XML abierto. Es .NET, no COM

Información: http://support.microsoft.com/kb/840817

Descargue el SDK: http://www.microsoft.com/en-us/download/details.aspx?displaylang=en&id=5124

Debe utilizar “Abrir Xml” para obtener información de formato si no desea utilizar Interop. No hay otra opción. Hay Biff que menciono solo para que sea correcto, pero su cadena de conexión indica claramente XML, por lo que Biff está fuera.

Una vez que abre a través de “Open Xml”, puede “simular” la lectura del rango / tabla / celdas como un DataTable .

Con sus restricciones, Sólo el número 1 le dará información de formato.