You are viewing a plain text version of this content. The canonical link for it is here.

Posted to dev@carbondata.apache.org by yixu2001 <yi...@163.com> on 2017/09/13 10:25:31 UTC

Block B-tree loading failed

dev 

spark2.1.1  carbon 1.1.1


scala> cc.sql("select area_code,count(*) from e_carbon.prod_inst_cold group by area_code").show;                                                                                                                                                                                                                                                                                                                                                                                                                        
[Stage 0:>                                                       (0 + 18) / 243]17/09/13 17:48:33 WARN scheduler.TaskSetManager: Lost task 8.0 in stage 0.0 (TID 17, HDD008, executor 3): org.apache.carbondata.core.datastore.exception.IndexBuilderException: Block B-tree loading failed                                                                                                                                                                                                                             
at org.apache.carbondata.core.datastore.BlockIndexStore.fillLoadedBlocks(BlockIndexStore.java:264)                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.carbondata.core.datastore.BlockIndexStore.getAll(BlockIndexStore.java:189)                                                                                                                                                                                                                                                                                                                                                                                                                              
at org.apache.carbondata.core.scan.executor.impl.AbstractQueryExecutor.initQuery(AbstractQueryExecutor.java:131)                                                                                                                                                                                                                                                                                                                                                                                                      
at org.apache.carbondata.core.scan.executor.impl.AbstractQueryExecutor.getBlockExecutionInfos(AbstractQueryExecutor.java:186)                                                                                                                                                                                                                                                                                                                                                                                         
at org.apache.carbondata.core.scan.executor.impl.VectorDetailQueryExecutor.execute(VectorDetailQueryExecutor.java:36)                                                                                                                                                                                                                                                                                                                                                                                                 
at org.apache.carbondata.spark.vectorreader.VectorizedCarbonRecordReader.initialize(VectorizedCarbonRecordReader.java:112)                                                                                                                                                                                                                                                                                                                                                                                            
at org.apache.carbondata.spark.rdd.CarbonScanRDD.compute(CarbonScanRDD.scala:204)                                                                                                                                                                                                                                                                                                                                                                                                                                     
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)                                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)                                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:96)                                                                                                                                                                                                                                                                                                                                                                                                                                         
at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:53)                                                                                                                                                                                                                                                                                                                                                                                                                                         
at org.apache.spark.scheduler.Task.run(Task.scala:99)                                                                                                                                                                                                                                                                                                                                                                                                                                                                 
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:322)                                                                                                                                                                                                                                                                                                                                                                                                                                              
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)                                                                                                                                                                                                                                                                                                                                                                                                                                    
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)                                                                                                                                                                                                                                                                                                                                                                                                                                    
at java.lang.Thread.run(Thread.java:745)                                                                                                                                                                                                                                                                                                                                                                                                                                                                              
Caused by: java.util.concurrent.ExecutionException: org.apache.carbondata.core.datastore.exception.IndexBuilderException: Invalid carbon data file: hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata                                                                                                                                                                                                                             
at java.util.concurrent.FutureTask.report(FutureTask.java:122)                                                                                                                                                                                                                                                                                                                                                                                                                                                        
at java.util.concurrent.FutureTask.get(FutureTask.java:192)                                                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.carbondata.core.datastore.BlockIndexStore.fillLoadedBlocks(BlockIndexStore.java:254)                                                                                                                                                                                                                                                                                                                                                                                                                    
... 21 more                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           
Caused by: org.apache.carbondata.core.datastore.exception.IndexBuilderException: Invalid carbon data file: hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata                                                                                                                                                                                                                                                                      
at org.apache.carbondata.core.datastore.AbstractBlockIndexStoreCache.checkAndLoadTableBlocks(AbstractBlockIndexStoreCache.java:110)                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.carbondata.core.datastore.BlockIndexStore.loadBlock(BlockIndexStore.java:304)                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.carbondata.core.datastore.BlockIndexStore.get(BlockIndexStore.java:109)                                                                                                                                                                                                                                                                                                                                                                                                                                 
at org.apache.carbondata.core.datastore.BlockIndexStore$BlockLoaderThread.call(BlockIndexStore.java:294)                                                                                                                                                                                                                                                                                                                                                                                                              
at org.apache.carbondata.core.datastore.BlockIndexStore$BlockLoaderThread.call(BlockIndexStore.java:284)                                                                                                                                                                                                                                                                                                                                                                                                              
at java.util.concurrent.FutureTask.run(FutureTask.java:266)                                                                                                                                                                                                                                                                                                                                                                                                                                                           
... 3 more                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        
[Stage 0:===================================================>  (231 + 12) / 243]17/09/13 17:48:39 ERROR scheduler.TaskSetManager: Task 8 in stage 0.0 failed 10 times; aborting job                                                                                                                                                                                                                                                                                                                                     
17/09/13 17:48:39 WARN spark.ExecutorAllocationManager: No stages are running, but numRunningTasks != 0                                                                                                                                                                                                                                                                                                                                                                                                                 
org.apache.spark.SparkException: Job aborted due to stage failure: Task 8 in stage 0.0 failed 10 times, most recent failure: Lost task 8.9 in stage 0.0 (TID 251, HDD023, executor 4): org.apache.carbondata.core.datastore.exception.IndexBuilderException: Block B-tree loading failed                                                                                                                                                                                                                                
at org.apache.carbondata.core.datastore.BlockIndexStore.fillLoadedBlocks(BlockIndexStore.java:264)                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.carbondata.core.datastore.BlockIndexStore.getAll(BlockIndexStore.java:189)                                                                                                                                                                                                                                                                                                                                                                                                                              
at org.apache.carbondata.core.scan.executor.impl.AbstractQueryExecutor.initQuery(AbstractQueryExecutor.java:131)                                                                                                                                                                                                                                                                                                                                                                                                      
at org.apache.carbondata.core.scan.executor.impl.AbstractQueryExecutor.getBlockExecutionInfos(AbstractQueryExecutor.java:186)                                                                                                                                                                                                                                                                                                                                                                                         
at org.apache.carbondata.core.scan.executor.impl.VectorDetailQueryExecutor.execute(VectorDetailQueryExecutor.java:36)                                                                                                                                                                                                                                                                                                                                                                                                 
at org.apache.carbondata.spark.vectorreader.VectorizedCarbonRecordReader.initialize(VectorizedCarbonRecordReader.java:112)                                                                                                                                                                                                                                                                                                                                                                                            
at org.apache.carbondata.spark.rdd.CarbonScanRDD.compute(CarbonScanRDD.scala:204)                                                                                                                                                                                                                                                                                                                                                                                                                                     
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)                                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)                                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:96)                                                                                                                                                                                                                                                                                                                                                                                                                                         
at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:53)                                                                                                                                                                                                                                                                                                                                                                                                                                         
at org.apache.spark.scheduler.Task.run(Task.scala:99)                                                                                                                                                                                                                                                                                                                                                                                                                                                                 
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:322)                                                                                                                                                                                                                                                                                                                                                                                                                                              
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)                                                                                                                                                                                                                                                                                                                                                                                                                                    
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)                                                                                                                                                                                                                                                                                                                                                                                                                                    
at java.lang.Thread.run(Thread.java:745)                                                                                                                                                                                                                                                                                                                                                                                                                                                                              
Caused by: java.util.concurrent.ExecutionException: org.apache.carbondata.core.datastore.exception.IndexBuilderException: Invalid carbon data file: hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata                                                                                                                                                                                                                             
at java.util.concurrent.FutureTask.report(FutureTask.java:122)                                                                                                                                                                                                                                                                                                                                                                                                                                                        
at java.util.concurrent.FutureTask.get(FutureTask.java:192)                                                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.carbondata.core.datastore.BlockIndexStore.fillLoadedBlocks(BlockIndexStore.java:254)                                                                                                                                                                                                                                                                                                                                                                                                                    
... 21 more                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           
Caused by: org.apache.carbondata.core.datastore.exception.IndexBuilderException: Invalid carbon data file: hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata                                                                                                                                                                                                                                                                      
at org.apache.carbondata.core.datastore.AbstractBlockIndexStoreCache.checkAndLoadTableBlocks(AbstractBlockIndexStoreCache.java:110)                                                                                                                                                                                                                                                                                                                                                                                   
at org.apache.carbondata.core.datastore.BlockIndexStore.loadBlock(BlockIndexStore.java:304)                                                                                                                                                                                                                                                                                                                                                                                                                           
at org.apache.carbondata.core.datastore.BlockIndexStore.get(BlockIndexStore.java:109)                                                                                                                                                                                                                                                                                                                                                                                                                                 
at org.apache.carbondata.core.datastore.BlockIndexStore$BlockLoaderThread.call(BlockIndexStore.java:294)                                                                                                                                                                                                                                                                                                                                                                                                              
at org.apache.carbondata.core.datastore.BlockIndexStore$BlockLoaderThread.call(BlockIndexStore.java:284)                                                                                                                                                                                                                                                                                                                                                                                                              
at java.util.concurrent.FutureTask.run(FutureTask.java:266)                                                                                                                                                                                                                                                                                                                                                                                                                                                           
... 3 more                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        
Driver stacktrace:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      
  at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$failJobAndIndependentStages(DAGScheduler.scala:1435)                                                                                                                                                                                                                                                                                                                                                                              
  at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1423)                                                                                                                                                                                                                                                                                                                                                                                                                       
  at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1422)                                                                                                                                                                                                                                                                                                                                                                                                                       
  at scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:59)                                                                                                                                                                                                                                                                                                                                                                                                                                     
  at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:48)                                                                                                                                                                                                                                                                                                                                                                                                                                                 
  at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:1422)                                                                                                                                                                                                                                                                                                                                                                                                                                        
  at org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:802)                                                                                                                                                                                                                                                                                                                                                                                                               
  at org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:802)                                                                                                                                                                                                                                                                                                                                                                                                               
  at scala.Option.foreach(Option.scala:257)                                                                                                                                                                                                                                                                                                                                                                                                                                                                             
  at org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:802)                                                                                                                                                                                                                                                                                                                                                                                                                                
  at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:1650)                                                                                                                                                                                                                                                                                                                                                                                                                       
  at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:1605)                                                                                                                                                                                                                                                                                                                                                                                                                         
  at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:1594)                                                                                                                                                                                                                                                                                                                                                                                                                         
  at org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:48)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  at org.apache.spark.scheduler.DAGScheduler.runJob(DAGScheduler.scala:628)                                                                                                                                                                                                                                                                                                                                                                                                                                             
  at org.apache.spark.SparkContext.runJob(SparkContext.scala:1925)                                                                                                                                                                                                                                                                                                                                                                                                                                                      
  at org.apache.spark.SparkContext.runJob(SparkContext.scala:1938)                                                                                                                                                                                                                                                                                                                                                                                                                                                      
  at org.apache.spark.SparkContext.runJob(SparkContext.scala:1951)                                                                                                                                                                                                                                                                                                                                                                                                                                                      
  at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:333)                                                                                                                                                                                                                                                                                                                                                                                                                                          
  at org.apache.spark.sql.execution.CollectLimitExec.executeCollect(limit.scala:38)                                                                                                                                                                                                                                                                                                                                                                                                                                     
  at org.apache.spark.sql.Dataset$$anonfun$org$apache$spark$sql$Dataset$$execute$1$1.apply(Dataset.scala:2386)                                                                                                                                                                                                                                                                                                                                                                                                          
  at org.apache.spark.sql.execution.SQLExecution$.withNewExecutionId(SQLExecution.scala:57)                                                                                                                                                                                                                                                                                                                                                                                                                             
  at org.apache.spark.sql.Dataset.withNewExecutionId(Dataset.scala:2788)                                                                                                                                                                                                                                                                                                                                                                                                                                                
  at org.apache.spark.sql.Dataset.org$apache$spark$sql$Dataset$$execute$1(Dataset.scala:2385)                                                                                                                                                                                                                                                                                                                                                                                                                           
  at org.apache.spark.sql.Dataset.org$apache$spark$sql$Dataset$$collect(Dataset.scala:2392)                                                                                                                                                                                                                                                                                                                                                                                                                             
  at org.apache.spark.sql.Dataset$$anonfun$head$1.apply(Dataset.scala:2128)                                                                                                                                                                                                                                                                                                                                                                                                                                             
  at org.apache.spark.sql.Dataset$$anonfun$head$1.apply(Dataset.scala:2127)                                                                                                                                                                                                                                                                                                                                                                                                                                             
  at org.apache.spark.sql.Dataset.withTypedCallback(Dataset.scala:2818)                                                                                                                                                                                                                                                                                                                                                                                                                                                 
  at org.apache.spark.sql.Dataset.head(Dataset.scala:2127)                                                                                                                                                                                                                                                                                                                                                                                                                                                              
  at org.apache.spark.sql.Dataset.take(Dataset.scala:2342)                                                                                                                                                                                                                                                                                                                                                                                                                                                              
  at org.apache.spark.sql.Dataset.showString(Dataset.scala:248)                                                                                                                                                                                                                                                                                                                                                                                                                                                         
  at org.apache.spark.sql.Dataset.show(Dataset.scala:638)                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  at org.apache.spark.sql.Dataset.show(Dataset.scala:597)                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  at org.apache.spark.sql.Dataset.show(Dataset.scala:606)                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  ... 50 elided                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         
Caused by: org.apache.carbondata.core.datastore.exception.IndexBuilderException: Block B-tree loading failed                                                                                                                                                                                                                                                                                                                                                                                                            
  at org.apache.carbondata.core.datastore.BlockIndexStore.fillLoadedBlocks(BlockIndexStore.java:264)                                                                                                                                                                                                                                                                                                                                                                                                                    
  at org.apache.carbondata.core.datastore.BlockIndexStore.getAll(BlockIndexStore.java:189)                                                                                                                                                                                                                                                                                                                                                                                                                              
  at org.apache.carbondata.core.scan.executor.impl.AbstractQueryExecutor.initQuery(AbstractQueryExecutor.java:131)                                                                                                                                                                                                                                                                                                                                                                                                      
  at org.apache.carbondata.core.scan.executor.impl.AbstractQueryExecutor.getBlockExecutionInfos(AbstractQueryExecutor.java:186)                                                                                                                                                                                                                                                                                                                                                                                         
  at org.apache.carbondata.core.scan.executor.impl.VectorDetailQueryExecutor.execute(VectorDetailQueryExecutor.java:36)                                                                                                                                                                                                                                                                                                                                                                                                 
  at org.apache.carbondata.spark.vectorreader.VectorizedCarbonRecordReader.initialize(VectorizedCarbonRecordReader.java:112)                                                                                                                                                                                                                                                                                                                                                                                            
  at org.apache.carbondata.spark.rdd.CarbonScanRDD.compute(CarbonScanRDD.scala:204)                                                                                                                                                                                                                                                                                                                                                                                                                                     
  at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
  at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)                                                                                                                                                                                                                                                                                                                                                                                                                                           
  at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
  at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)                                                                                                                                                                                                                                                                                                                                                                                                                                           
  at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)                                                                                                                                                                                                                                                                                                                                                                                                                                                                   
  at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:96)                                                                                                                                                                                                                                                                                                                                                                                                                                         
  at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:53)                                                                                                                                                                                                                                                                                                                                                                                                                                         
  at org.apache.spark.scheduler.Task.run(Task.scala:99)                                                                                                                                                                                                                                                                                                                                                                                                                                                                 
  at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:322)                                                                                                                                                                                                                                                                                                                                                                                                                                              
  at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)                                                                                                                                                                                                                                                                                                                                                                                                                                    
  at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)                                                                                                                                                                                                                                                                                                                                                                                                                                    
  at java.lang.Thread.run(Thread.java:745)                                                                                                                                                                                                                                                                                                                                                                                                                                                                              
Caused by: java.util.concurrent.ExecutionException: org.apache.carbondata.core.datastore.exception.IndexBuilderException: Invalid carbon data file: hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata                                                                                                                                                                                                                             
  at java.util.concurrent.FutureTask.report(FutureTask.java:122)                                                                                                                                                                                                                                                                                                                                                                                                                                                        
  at java.util.concurrent.FutureTask.get(FutureTask.java:192)                                                                                                                                                                                                                                                                                                                                                                                                                                                           
  at org.apache.carbondata.core.datastore.BlockIndexStore.fillLoadedBlocks(BlockIndexStore.java:254)                                                                                                                                                                                                                                                                                                                                                                                                                    
  ... 21 more                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           
Caused by: org.apache.carbondata.core.datastore.exception.IndexBuilderException: Invalid carbon data file: hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata                                                                                                                                                                                                                                                                      
  at org.apache.carbondata.core.datastore.AbstractBlockIndexStoreCache.checkAndLoadTableBlocks(AbstractBlockIndexStoreCache.java:110)                                                                                                                                                                                                                                                                                                                                                                                   
  at org.apache.carbondata.core.datastore.BlockIndexStore.loadBlock(BlockIndexStore.java:304)                                                                                                                                                                                                                                                                                                                                                                                                                           
  at org.apache.carbondata.core.datastore.BlockIndexStore.get(BlockIndexStore.java:109)                                                                                                                                                                                                                                                                                                                                                                                                                                 
  at org.apache.carbondata.core.datastore.BlockIndexStore$BlockLoaderThread.call(BlockIndexStore.java:294)                                                                                                                                                                                                                                                                                                                                                                                                              
  at org.apache.carbondata.core.datastore.BlockIndexStore$BlockLoaderThread.call(BlockIndexStore.java:284)                                                                                                                                                                                                                                                                                                                                                                                                              
  at java.util.concurrent.FutureTask.run(FutureTask.java:266)                                                                                                                                                                                                                                                                                                                                                                                                                                                           
  ... 3 more                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            



 


yixu2001

Re: Re: Block B-tree loading failed

Posted by yixu2001 <yi...@163.com>.

dev, chenliang6136 

hi
environment  spark.2.1.1 carbondata 1.1.1  hadoop 2.7.2

import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.CarbonSession._
val cc = SparkSession.builder().config(sc.getConf).getOrCreateCarbonSession("hdfs://ns1/user/e_carbon/public/carbon.store") 


Repeated execution


---增量表排重
cc.sql(" cache table cache_prod_inst_add as select PROD_INST_ID,case when evttype='INSERT' then '70A' WHEN evttype='UPDATE' then '70A' ELSE 'DEL' END ODS_STATE,KAFKA_DATE,IND,GTID,PRODUCT_ID,ACC_PROD_INST_ID,ADDRESS_ID,OWNER_CUST_ID,PAYMENT_MODE_CD,PRODUCT_PASSWORD,IMPORTANT_LEVEL,AREA_CODE,ACC_NBR,EXCH_ID,COMMON_REGION_ID,REMARK,PAY_CYCLE,BEGIN_RENT_TIME,STOP_RENT_TIME,FINISH_TIME,STOP_STATUS,STATUS_CD,CREATE_DATE,STATUS_DATE,UPDATE_DATE,PROC_SERIAL,USE_CUST_ID,EXT_PROD_INST_ID,ADDRESS_DESC,AREA_ID,UPDATE_STAFF,CREATE_STAFF,REC_UPDATE_DATE,ACCOUNT,VERSION,COMMUNITY_ID,EXT_ACC_PROD_INST_ID,DISTRIBUTOR_ID,SHARDING_ID,REC_TIME  from (select a.*, row_number() over(partition by a.prod_inst_id order by a.gtid desc ,a.ind desc) rownum from  e_carbon.prod_inst_ADD_H a ) b where b.rownum=1").show
-----在找出在1表已有的数据
cc.sql("cache table cache_prod_inst_exist as select a.* from e_carbon.prod_inst_c a,cache_prod_inst_add b where a.prod_inst_id=b.prod_inst_id").show;
-----版本比较找出需要更新的数据
cc.sql("cache table cache_prod_inst_U as select prod_inst_id, OWNER_CUST_ID,ACC_PROD_INST_ID,'0' DVERSION,GTID,IND,ODS_STATE, 'UMQ' SRC,date_format(current_timestamp(),'yyyyMMddhhmmss') ods_date,kafka_date,PRODUCT_ID,ADDRESS_ID,PAYMENT_MODE_CD,PRODUCT_PASSWORD,IMPORTANT_LEVEL,AREA_CODE,ACC_NBR,EXCH_ID,COMMON_REGION_ID,REMARK,PAY_CYCLE,BEGIN_RENT_TIME,STOP_RENT_TIME,FINISH_TIME,STOP_STATUS,STATUS_CD,CREATE_DATE,STATUS_DATE,UPDATE_DATE,PROC_SERIAL,USE_CUST_ID,EXT_PROD_INST_ID,ADDRESS_DESC,AREA_ID,UPDATE_STAFF,CREATE_STAFF,REC_UPDATE_DATE,ACCOUNT,VERSION,COMMUNITY_ID,EXT_ACC_PROD_INST_ID,DISTRIBUTOR_ID,SHARDING_ID from (select b.* from cache_prod_inst_exist a,cache_prod_inst_add b where a.prod_inst_id=b.prod_inst_id  and  b.gtid>a.gtid union all select b.* from  cache_prod_inst_exist a,cache_prod_inst_add b where a.prod_inst_id=b.prod_inst_id and  a.gtid=b.gtid and b.ind>a.ind)").show;
--UPDATE数据
cc.sql("update e_carbon.prod_inst_c  A set (a.OWNER_CUST_ID,a.ACC_PROD_INST_ID,a.DVERSION,a.GTID,a.IND,a.ODS_STATE,A.SRC,a.ods_date,a.kafka_date,a.PRODUCT_ID,a.ADDRESS_ID,a.PAYMENT_MODE_CD,a.PRODUCT_PASSWORD,a.IMPORTANT_LEVEL,a.AREA_CODE,a.ACC_NBR,a.EXCH_ID,a.COMMON_REGION_ID,a.REMARK,a.PAY_CYCLE,a.BEGIN_RENT_TIME,a.STOP_RENT_TIME,a.FINISH_TIME,a.STOP_STATUS,a.STATUS_CD,a.CREATE_DATE,a.STATUS_DATE,a.UPDATE_DATE,a.PROC_SERIAL,a.USE_CUST_ID,a.EXT_PROD_INST_ID,a.ADDRESS_DESC,a.AREA_ID,a.UPDATE_STAFF,a.CREATE_STAFF,a.REC_UPDATE_DATE,a.ACCOUNT,a.VERSION,a.COMMUNITY_ID,a.EXT_ACC_PROD_INST_ID,a.DISTRIBUTOR_ID,a.SHARDING_ID)=(select b.OWNER_CUST_ID,b.ACC_PROD_INST_ID,B.DVERSION,b.GTID,b.IND,B.ODS_STATE,B.SRC,b.ods_date,b.kafka_date,b.PRODUCT_ID,b.ADDRESS_ID,b.PAYMENT_MODE_CD,b.PRODUCT_PASSWORD,b.IMPORTANT_LEVEL,b.AREA_CODE,b.ACC_NBR,b.EXCH_ID,b.COMMON_REGION_ID,b.REMARK,b.PAY_CYCLE,b.BEGIN_RENT_TIME,b.STOP_RENT_TIME,b.FINISH_TIME,b.STOP_STATUS,b.STATUS_CD,b.CREATE_DATE,b.STATUS_DATE,b.UPDATE_DATE,b.PROC_SERIAL,b.USE_CUST_ID,b.EXT_PROD_INST_ID,b.ADDRESS_DESC,b.AREA_ID,b.UPDATE_STAFF,b.CREATE_STAFF,b.REC_UPDATE_DATE,b.ACCOUNT,b.VERSION,b.COMMUNITY_ID,b.EXT_ACC_PROD_INST_ID,b.DISTRIBUTOR_ID,b.SHARDING_ID from cache_prod_inst_u b where b.prod_inst_id=a.prod_inst_id)").show;
---insert新增的数据
cc.sql(" insert into e_carbon.prod_inst_c select  PROD_INST_ID,OWNER_CUST_ID,ACC_PROD_INST_ID,'0' DVERSION,GTID,IND,ODS_STATE,'MQ' SRC,date_format(current_timestamp(),'yyyyMMddhhmmss') ods_date,kafka_date,PRODUCT_ID,ADDRESS_ID,PAYMENT_MODE_CD,PRODUCT_PASSWORD,IMPORTANT_LEVEL,AREA_CODE,ACC_NBR,EXCH_ID,COMMON_REGION_ID,REMARK,PAY_CYCLE,BEGIN_RENT_TIME,STOP_RENT_TIME,FINISH_TIME,STOP_STATUS,STATUS_CD,CREATE_DATE,STATUS_DATE,UPDATE_DATE,PROC_SERIAL,USE_CUST_ID,EXT_PROD_INST_ID,ADDRESS_DESC,AREA_ID,UPDATE_STAFF,CREATE_STAFF,REC_UPDATE_DATE,ACCOUNT,VERSION,COMMUNITY_ID,EXT_ACC_PROD_INST_ID,DISTRIBUTOR_ID,SHARDING_ID from (select a.*,b.prod_Inst_id bprod_inst_id  from cache_prod_inst_add  a left outer join cache_prod_inst_exist b on a.prod_inst_id=b.prod_inst_id) c where c.bprod_inst_id is null").show;


 cc.sql("select area_code,count(*) from e_carbon.prod_inst_c group by area_code").show;    
“Lost task 16.1 in stage 0.0 (TID 51, HDD014, executor 4): org.apache.carbondata.core.datastore.exception.IndexBuilderException: 
at org.apache.carbondata.core.datastore.BlockIndexStore.getAll(BlockIndexStore.java:186)

table  unavailable   How to recover table ?



yixu2001
 
From: Liang Chen
Date: 2017-09-13 21:43
To: dev
Subject: Re: Block B-tree loading failed
Hi 
 
Looks that the path is invalid, can you provide full script: how you created
carbonsession?
-----------------------------
Caused by:
org.apache.carbondata.core.datastore.exception.IndexBuilderException:
Invalid carbon data file:
hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata  
 
 
 
--
Sent from: http://apache-carbondata-dev-mailing-list-archive.1130556.n5.nabble.com/

Re: Block B-tree loading failed

Posted by Liang Chen <ch...@gmail.com>.

Hi 

Looks that the path is invalid, can you provide full script: how you created
carbonsession?
-----------------------------
Caused by:
org.apache.carbondata.core.datastore.exception.IndexBuilderException:
Invalid carbon data file:
hdfs://ns1/user/e_carbon/public/carbon.store/e_carbon/prod_inst_cold/Fact/Part0/Segment_0/part-0-30_batchno0-0-1505272524271.carbondata  



--
Sent from: http://apache-carbondata-dev-mailing-list-archive.1130556.n5.nabble.com/