Iteração 19 de Novembro de 2010
Participantes:
- SciELO/FapUnifesp
- Adriana Luccisano
- BIREME/OPAS/OMS
- Renato Murasaki
Cenários técnicos na operação da coleção SciELO Livros
NOTA: esse documento é um rascunho das idéias discutidas sobre a operação da coleção SciELO Livros, frente aos diferentes formatos e tipos de conteúdo dos livros. Outros documentos serão gerados a partir das idéias aqui registradas.
Formatos de entrada para publicação na coleção SciELO Livros
Arquivo PDF a partir do resultado da diagramação/impressão da editora/gráfica
- Arquivos grandes
- Está em alta resolução para impressão
- Tentativa de diminuição para web
- Manter alta para impressão?
- Está em baixa resolução com o mínimo de qualidade
- Ver limite de navegação do PDF via browser
- Só disponibiliza navegação por capítulo
- Download do todo, partes, ou por capítulo
- Está em alta resolução para impressão
- Arquivos encriptados
- Solicitar outro para editor
- Arquivos abertos
- Verificar tamanho do arquivo
- Verificar qualidade da resolução
- Imagens estão embed ou são referências externas?
- Referências externas precisa enviar imagens
- Qual a classificação do conteúdo?
- Só texto: prepara PDF, XHTML e ePub
- Híbrido: prepara PDF e avalia XHTML
- Imagem: avalia todos os formatos (item 1)
Arquivos em outros formatos abertos
- PDF
- Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
- Word
- Realizar marcação de referências bibliográficas
- Pagemaker
- Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
- InDesign?
- Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
- Ventura
- Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
Possibilidade, em todos os casos acima, de gerar ePub automaticamente? Ou gerar XHTML por capítulo para servir de browser e ePub?
Livros impressos (necessidade de digitalização)
- Contratar serviço externo
- Formato TIFF ou JPEG2000
- PDF imagem
- PDF OCR
- PDF + OCR separado (XML? TXT?)
- ePUB automático?
- Formato TIFF ou JPEG2000
- Criar capacidade interna?
Referências bibliográficas do livro
- BibTex?
- Reference Manager
- Pro Cite
- End Note
- Refworks
- Outro?
Formatos de saída para publicação na coleção SciELO Livros
Metadados
- Editora
- Coleção do Livro
- Nível monográfico
- Nível analítico
PDF para download e visualização on-line (baixa resolução)
- da obra
- dos capítulos
PDF para impressão (tanto para print on demand como para download)
- da obra
- dos capítulos
ePUB
- da obra (disponibilizar para download)
- arquivos de controle do ePUB em formato XML (geração “automática” via back-end da plataforma SciELO Livros)
- arquivos em formato XHTML para cada capítulo
- arquivos jpg; png; gif para as respectivas imagens
XHTML – no futuro HTML5?
- por capítulo para ser visualizado no browser
- os mesmos do formato ePUB
- referências bibliográficas
- geradas a partir da marcação SciELO
Classificação para processamento técnico dos livros na metodologia SciELO Livros (conteúdo)
- Livros essencialmente texto
- Livros essencialmente imagem
- Livros híbridos
Próximos passos
- Analisar itens acima e desenvolver fluxo de trabalho e decisório
- Completar planilha do Google Docs com informação sobre tipo de conteúdo (texto, imagem ou híbrido), outros formatos (pagemaker, indesign, ventura etc) tamanho (MB) e resolução de cada um dos livros que tem PDF disponível
- Disponibilizar os PDFs de todos os livros, incluindo os capítulo que já foram separados