Improve accuracy of page detectors

The low accuracies in [the experimental notebook][accuracies] from #3 are worrying:

Page Detector | random | `siamese` | `imagehash` | `vgg16` | `annotated`
---|---|---|---|---|---|
Accuracy | 0.03% | 3.95% | 6.58% | 61.84% | 100.00%

[The `vgg16` page detector][vgg16] currently uses features produced by the last hiddent layer of a VGG16 model trained on ImageNet. Finetuning may not be an option, since our dataset is ill-suited for classification (too many document pages/classes, too few examples of each class). However, since our dataset is significantly different from ImageNet, we may have better luck using an earlier hidden layer of VGG16:

- [ ] Update [the implementation][vgg16].
- [ ] Optimize [the parameters][vgg16-parameters].
- [ ] [Evaluate][accuracies].

[The `siamese` page detector][siamese] uses [position-dependent samples][siamese-moments] to normalize the input screen images, which may explain why the performance degrades on new document page and screen images ([86% accuracy on training set][siamese-parameters] versus [3.95% accuracy on test set][accuracies]):

- [ ] Update [the implementation][siamese-moments].
- [ ] [Estimate performance using CV][siamese-training].
- [ ] Train and optimize [the parameters][siamese-parameters].
- [ ] [Evaluate][accuracies].

If we manage to improve [the `siamese` page detector][siamese], we may benefit from [ensembling `siamese` with `vgg16`][ensemble]:

- [ ] [Estimate performance using CV][ensemble].
- [ ] Add `ensemble` page detector to `video699.__main__`.
- [ ] [Evaluate][accuracies].

 [ensemble]: https://github.com/video699/implementation-system/blob/master/docs/notebooks/page/ensemble/parameter_optimization.ipynb
 [vgg16]: https://github.com/video699/implementation-system/blob/master/video699/page/vgg16.py
 [siamese]: https://github.com/video699/implementation-system/blob/master/video699/page/siamese.py
 [siamese-moments]: https://github.com/video699/implementation-system/blob/master/video699/page/siamese.py#L66
 [siamese-parameters]: https://github.com/video699/implementation-system/blob/master/docs/notebooks/page/siamese/parameter_optimization.ipynb
 [siamese-training]: https://github.com/video699/implementation-system/blob/master/docs/notebooks/page/siamese/evaluation.ipynb
 [vgg16-parameters]: https://github.com/video699/implementation-system/blob/master/docs/notebooks/page/vgg16/parameter_optimization.ipynb
 [accuracies]: https://github.com/video699/implementation-system/blob/eff545ad942b9990e5cf5948eab6cd2c1846ecae/docs/notebooks/__main__/speed_and_accuracy.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Improve accuracy of page detectors #5

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Improve accuracy of page detectors #5

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions