init
This commit is contained in:
commit
c12c5f9df9
144
main.go
Normal file
144
main.go
Normal file
@ -0,0 +1,144 @@
|
|||||||
|
package main
|
||||||
|
|
||||||
|
import (
|
||||||
|
"crypto/md5"
|
||||||
|
"fmt"
|
||||||
|
"io"
|
||||||
|
"log"
|
||||||
|
"os"
|
||||||
|
"path/filepath"
|
||||||
|
"strings"
|
||||||
|
"sync"
|
||||||
|
)
|
||||||
|
|
||||||
|
const usage = "picmv <indir> <outdir>"
|
||||||
|
|
||||||
|
type input struct {
|
||||||
|
path string
|
||||||
|
hash string
|
||||||
|
ext string
|
||||||
|
}
|
||||||
|
|
||||||
|
type stats struct {
|
||||||
|
total int
|
||||||
|
moved int
|
||||||
|
}
|
||||||
|
|
||||||
|
func main() {
|
||||||
|
if len(os.Args) != 3 {
|
||||||
|
fmt.Fprintf(os.Stderr, "%s\n", usage)
|
||||||
|
os.Exit(1)
|
||||||
|
}
|
||||||
|
in, out := os.Args[1], os.Args[2]
|
||||||
|
log.Printf("%+v", in)
|
||||||
|
|
||||||
|
for i := 0; i <= 0xff; i++ {
|
||||||
|
dirname := filepath.Join(out, fmt.Sprintf("%02x", i))
|
||||||
|
os.MkdirAll(dirname, 0755)
|
||||||
|
}
|
||||||
|
|
||||||
|
st := stats{}
|
||||||
|
|
||||||
|
work := source(in)
|
||||||
|
res := []<-chan input{}
|
||||||
|
for w := 0; w < 16; w++ {
|
||||||
|
res = append(res, compute(work))
|
||||||
|
}
|
||||||
|
|
||||||
|
for in := range merge(res) {
|
||||||
|
if in.ext != ".jpg" {
|
||||||
|
log.Printf("%+v", in)
|
||||||
|
}
|
||||||
|
st.total++
|
||||||
|
finalDest := filepath.Join(out, in.hash[:2], in.hash[2:]+in.ext)
|
||||||
|
if _, err := os.Stat(finalDest); !os.IsNotExist(err) {
|
||||||
|
log.Printf("dup detected: %+v", in)
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
if err := os.Link(in.path, finalDest); err != nil {
|
||||||
|
log.Printf("%+v", err)
|
||||||
|
}
|
||||||
|
st.moved++
|
||||||
|
}
|
||||||
|
log.Printf("total files moved : %d", st.moved)
|
||||||
|
log.Printf("total files processed : %d", st.total)
|
||||||
|
}
|
||||||
|
|
||||||
|
func source(root string) <-chan string {
|
||||||
|
out := make(chan string)
|
||||||
|
go func() {
|
||||||
|
err := filepath.Walk(
|
||||||
|
root,
|
||||||
|
func(path string, info os.FileInfo, err error) error {
|
||||||
|
if info.IsDir() {
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
out <- path
|
||||||
|
return nil
|
||||||
|
},
|
||||||
|
)
|
||||||
|
if err != nil {
|
||||||
|
log.Printf("problem from crawling root %q: %+v", root, err)
|
||||||
|
}
|
||||||
|
close(out)
|
||||||
|
}()
|
||||||
|
return out
|
||||||
|
}
|
||||||
|
|
||||||
|
func compute(work <-chan string) <-chan input {
|
||||||
|
out := make(chan input)
|
||||||
|
go func() {
|
||||||
|
for path := range work {
|
||||||
|
h, err := _hash(path)
|
||||||
|
if err != nil {
|
||||||
|
log.Printf("problem hashing: %+v", err)
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
out <- h
|
||||||
|
}
|
||||||
|
close(out)
|
||||||
|
}()
|
||||||
|
return out
|
||||||
|
}
|
||||||
|
|
||||||
|
func merge(cs []<-chan input) <-chan input {
|
||||||
|
out := make(chan input)
|
||||||
|
var wg sync.WaitGroup
|
||||||
|
|
||||||
|
output := func(c <-chan input) {
|
||||||
|
for n := range c {
|
||||||
|
out <- n
|
||||||
|
}
|
||||||
|
wg.Done()
|
||||||
|
}
|
||||||
|
|
||||||
|
for _, c := range cs {
|
||||||
|
go output(c)
|
||||||
|
}
|
||||||
|
|
||||||
|
wg.Add(len(cs))
|
||||||
|
|
||||||
|
go func() {
|
||||||
|
wg.Wait()
|
||||||
|
close(out)
|
||||||
|
}()
|
||||||
|
return out
|
||||||
|
}
|
||||||
|
|
||||||
|
func _hash(path string) (input, error) {
|
||||||
|
f, err := os.Open(path)
|
||||||
|
if err != nil {
|
||||||
|
return input{}, fmt.Errorf("problem opening file: %v", err)
|
||||||
|
}
|
||||||
|
defer f.Close()
|
||||||
|
hash := md5.New()
|
||||||
|
if _, err := io.Copy(hash, f); err != nil {
|
||||||
|
return input{}, fmt.Errorf("problem calculating hash for %q: %+v", path, err)
|
||||||
|
}
|
||||||
|
r := input{
|
||||||
|
path: path,
|
||||||
|
hash: fmt.Sprintf("%x", hash.Sum(nil)),
|
||||||
|
ext: strings.ToLower(filepath.Ext(path)),
|
||||||
|
}
|
||||||
|
return r, nil
|
||||||
|
}
|
Loading…
Reference in New Issue
Block a user