Iteração 19 de Novembro de 2010

Participantes:

  • SciELO/FapUnifesp
    • Adriana Luccisano
  • BIREME/OPAS/OMS
    • Renato Murasaki

Cenários técnicos na operação da coleção SciELO Livros

NOTA: esse documento é um rascunho das idéias discutidas sobre a operação da coleção SciELO Livros, 
frente aos diferentes formatos e tipos de conteúdo dos livros. Outros documentos serão gerados a partir 
das idéias aqui registradas.

Formatos de entrada para publicação na coleção SciELO Livros

Arquivo PDF a partir do resultado da diagramação/impressão da editora/gráfica

  1. Arquivos grandes
    1. Está em alta resolução para impressão
      1. Tentativa de diminuição para web
      2. Manter alta para impressão?
    2. Está em baixa resolução com o mínimo de qualidade
      1. Ver limite de navegação do PDF via browser
      2. Só disponibiliza navegação por capítulo
      3. Download do todo, partes, ou por capítulo
  2. Arquivos encriptados
    1. Solicitar outro para editor
  3. Arquivos abertos
    1. Verificar tamanho do arquivo
    2. Verificar qualidade da resolução
    3. Imagens estão embed ou são referências externas?
      1. Referências externas precisa enviar imagens
    4. Qual a classificação do conteúdo?
      1. Só texto: prepara PDF, XHTML e ePub
      2. Híbrido: prepara PDF e avalia XHTML
      3. Imagem: avalia todos os formatos (item 1)

Arquivos em outros formatos abertos

  1. PDF
    1. Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
  2. Word
    1. Realizar marcação de referências bibliográficas
  3. Pagemaker
    1. Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
  4. InDesign?
    1. Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
  5. Ventura
    1. Converter para Word/RTF/TXT/HTML e realizar marcação de referências bibliográficas
Possibilidade, em todos os casos acima, de gerar ePub automaticamente?
Ou gerar XHTML por capítulo para servir de browser e ePub?

Livros impressos (necessidade de digitalização)

  1. Contratar serviço externo
    1. Formato TIFF ou JPEG2000
      1. PDF imagem
      2. PDF OCR
      3. PDF + OCR separado (XML? TXT?)
      4. ePUB automático?
  2. Criar capacidade interna?

Referências bibliográficas do livro

  1. BibTex?
  2. Reference Manager
  3. Pro Cite
  4. End Note
  5. Refworks
  6. Outro?

Formatos de saída para publicação na coleção SciELO Livros

Metadados

  1. Editora
  2. Coleção do Livro
  3. Nível monográfico
  4. Nível analítico

PDF para download e visualização on-line (baixa resolução)

  1. da obra
  2. dos capítulos

PDF para impressão (tanto para print on demand como para download)

  1. da obra
  2. dos capítulos

ePUB

  1. da obra (disponibilizar para download)
  2. arquivos de controle do ePUB em formato XML (geração “automática” via back-end da plataforma SciELO Livros)
  3. arquivos em formato XHTML para cada capítulo
  4. arquivos jpg; png; gif para as respectivas imagens

XHTML – no futuro HTML5?

  1. por capítulo para ser visualizado no browser
    1. os mesmos do formato ePUB
  2. referências bibliográficas
    1. geradas a partir da marcação SciELO

Classificação para processamento técnico dos livros na metodologia SciELO Livros (conteúdo)

  1. Livros essencialmente texto
  2. Livros essencialmente imagem
  3. Livros híbridos

Próximos passos

  1. Analisar itens acima e desenvolver fluxo de trabalho e decisório
  2. Completar planilha do Google Docs com informação sobre tipo de conteúdo (texto, imagem ou híbrido), outros formatos (pagemaker, indesign, ventura etc) tamanho (MB) e resolução de cada um dos livros que tem PDF disponível
  3. Disponibilizar os PDFs de todos os livros, incluindo os capítulo que já foram separados