golang/mikael/goduf: comparison goduf.go

equal deleted inserted replaced

-:e918b7e63748
+:a7662fbfbe02
 	noChecksum sumType = iota
 	fullChecksum
 	partialChecksum
 )
+type Options struct {
+	Summary     bool
+	OutToJSON   bool
+	SkipPartial bool
+	IgnoreEmpty bool
+}
 // Results contains the results of the duplicates search
 type Results struct {
 	Groups             []ResultSet `json:"groups"`
 	Duplicates         uint        `json:"duplicates"`
 	NumberOfSets       uint        `json:"number_of_sets"`
 		return fmt.Sprintf("%d %s", humanSize, units[n])
 	}
 	return fmt.Sprintf("%d bytes (%d %s)", sizeBytes, humanSize, units[n])
 }
-// It all starts here.
+func duf(dirs []string, options Options) (Results, error) {
-func main() {
 	var verbose bool
-	var summary bool
-	var outToJSON bool
-	var skipPartial bool
-	var ignoreEmpty bool
-	// Assertion on constant values
-	if minSizePartialChecksum <= 2*medsumBytes {
-		myLog.Fatal("Internal error: assert minSizePartialChecksum > 2*medsumBytes")
-	}
-	// Command line parameters parsingg
-	flag.BoolVar(&verbose, "verbose", false, "Be verbose (verbosity=1)")
-	flag.BoolVar(&verbose, "v", false, "See --verbose")
-	flag.BoolVar(&outToJSON, "json", false, "Use JSON format for output")
-	flag.BoolVar(&summary, "summary", false, "Do not display the duplicate list")
-	flag.BoolVar(&summary, "s", false, "See --summary")
-	flag.BoolVar(&skipPartial, "skip-partial", false, "Skip partial checksums")
-	flag.IntVar(&myLog.verbosity, "verbosity", 0,
-		"Set verbosity level (1-6)")
-	flag.IntVar(&myLog.verbosity, "vl", 0, "See verbosity")
-	timings := flag.Bool("timings", false, "Set detailed log timings")
-	flag.BoolVar(&ignoreEmpty, "no-empty", false, "Ignore empty files")
-	flag.Parse()
-	// Set verbosity: --verbose=true == --verbosity=1
 	if myLog.verbosity > 0 {
 		verbose = true
-	} else if verbose == true {
+	}
-		myLog.verbosity = 1
-	}
+	var results Results
-	if len(flag.Args()) == 0 {
-		// TODO: more helpful usage statement
-		myLog.Println(-1, "Usage:", os.Args[0],
-			"[options] base_directory|file...")
-		os.Exit(0)
-	}
-	// Change log format for benchmarking
-	if *timings {
-		myLog.SetBenchFlags()
-	}
 	data.sizeGroups = make(map[int64]*FileObjList)
 	myLog.Println(1, "* Reading file metadata")
-	for _, root := range flag.Args() {
+	for _, root := range dirs {
 		if err := filepath.Walk(root, visit); err != nil {
-			myLog.Printf(-1, "* Error: could not read file tree:\n")
+			return results, fmt.Errorf("could not read file tree: %v", err)
-			myLog.Printf(-1, "> %v\n", err)
-			os.Exit(1)
 		}
 	}
 	// Count empty files and drop them if they should be ignored
-	emptyCount := data.dropEmptyFiles(ignoreEmpty)
+	emptyCount := data.dropEmptyFiles(options.IgnoreEmpty)
 	// Display a small report
 	if verbose {
 		if data.ignoreCount > 0 {
 			myLog.Printf(1, "  %d special files were ignored\n",
 	myLog.Println(1, "* Computing checksums...")
 	var result foListList
 	if len(data.emptyFiles) > 0 {
 		result = append(result, data.emptyFiles)
 	}
-	result = append(result, data.findDupes(skipPartial)...)
+	result = append(result, data.findDupes(options.SkipPartial)...)
 	myLog.Println(3, "* Number of match groups:", len(result))
 	// Done!  Prepare results data
-	if len(result) > 0 && !summary {
+	if len(result) > 0 && !options.Summary {
 		myLog.Println(1, "* Dupes:")
 	}
 	// Sort files by path inside each group
 	for _, l := range result {
 		sort.Sort(byFilePathName(l))
 	}
 	// Sort groups by increasing size (of the duplicated files)
 	sort.Sort(byGroupFileSize(result))
-	var results Results
 	for _, l := range result {
 		size := uint64(l[0].Size())
 		// We do not count the size of the 1st item
 		// so we get only duplicate size.
 		results.Groups = append(results.Groups, newSet)
 	}
 	results.RedundantDataSizeH = formatSize(results.RedundantDataSize, true)
 	results.TotalFileCount = data.cmpt
+	return results, nil
+}
+// It all starts here.
+func main() {
+	var verbose bool
+	var options Options
+	// Assertion on constant values
+	if minSizePartialChecksum <= 2*medsumBytes {
+		myLog.Fatal("Internal error: assert minSizePartialChecksum > 2*medsumBytes")
+	}
+	// Command line parameters parsingg
+	flag.BoolVar(&verbose, "verbose", false, "Be verbose (verbosity=1)")
+	flag.BoolVar(&verbose, "v", false, "See --verbose")
+	flag.BoolVar(&options.OutToJSON, "json", false, "Use JSON format for output")
+	flag.BoolVar(&options.Summary, "summary", false, "Do not display the duplicate list")
+	flag.BoolVar(&options.Summary, "s", false, "See --summary")
+	flag.BoolVar(&options.SkipPartial, "skip-partial", false, "Skip partial checksums")
+	flag.IntVar(&myLog.verbosity, "verbosity", 0,
+		"Set verbosity level (1-6)")
+	flag.IntVar(&myLog.verbosity, "vl", 0, "See verbosity")
+	timings := flag.Bool("timings", false, "Set detailed log timings")
+	flag.BoolVar(&options.IgnoreEmpty, "no-empty", false, "Ignore empty files")
+	flag.Parse()
+	// Set verbosity: --verbose=true == --verbosity=1
+	if myLog.verbosity > 0 {
+		verbose = true
+	} else if verbose == true {
+		myLog.verbosity = 1
+	}
+	if len(flag.Args()) == 0 {
+		// TODO: more helpful usage statement
+		myLog.Println(-1, "Usage:", os.Args[0],
+			"[options] base_directory|file...")
+		os.Exit(0)
+	}
+	// Change log format for benchmarking
+	if *timings {
+		myLog.SetBenchFlags()
+	}
+	results, err := duf(flag.Args(), options)
+	if err != nil {
+		myLog.Fatal("ERROR: " + err.Error())
+	}
 	// Output the results
-	displayResults(results, outToJSON, summary)
+	displayResults(results, options.OutToJSON, options.Summary)
 }

changeset 37	a7662fbfbe02
parent 36	e918b7e63748
child 38	25db238bf03f