Merge remote-tracking branch 'upstream/main' into nightly/explicit-pa…

…rquet-definitions
deephaven · devinrsmith · Nov 16, 2023 · Nov 13, 2023 · Nov 15, 2023 · Nov 15, 2023
commit debb9a384d0066e0d09d3ac46bb58693ae1f04ec
diff --git a/...ons/parquet/table/src/test/java/io/deephaven/parquet/table/ParquetTableReadWriteTest.java b/...ons/parquet/table/src/test/java/io/deephaven/parquet/table/ParquetTableReadWriteTest.java
@@ -934,7 +934,7 @@ public void partitionedParquetWithDotFilesTest() throws IOException {
         writeTable(someTable, secondDataFile);
 
         Table partitionedTable = readKeyValuePartitionedTable(parentDir, EMPTY).select();
-        final Set<?> columnsSet = partitionedTable.getColumnSourceMap().keySet();
+        final Set<String> columnsSet = partitionedTable.getDefinition().getColumnNameSet();
         assertTrue(columnsSet.size() == 2 && columnsSet.contains("A") && columnsSet.contains("X"));
 
         // Add an empty dot file and dot directory (with valid parquet files) in one of the partitions

@@ -383,7 +383,9 @@ def time_test_helper(pa_table, new_schema, dest):
             # Write the provided pyarrow table type-casted to the new schema
             pyarrow.parquet.write_table(pa_table.cast(new_schema), dest)
             from_disk = read(dest, type=ParquetType.SINGLE)
-            df_from_disk = to_pandas(from_disk)
+
+            # TODO dtype_backend=None is a workaround until https://github.com/deephaven/deephaven-core/issues/4823 is fixed
+            df_from_disk = to_pandas(from_disk, dtype_backend=None)
             original_df = pa_table.to_pandas()
             # Compare the dataframes as strings
             self.assertTrue((df_from_disk.astype(str) == original_df.astype(str)).all().values.all())