tutorial/data-main_8createssgrammar_8hpp_source.html

 // Licensed under the Apache License, Version 2.0 (the "License");
 // you may not use these files except in compliance with the License.
 // You may obtain a copy of the License at
 //
 //    http://www.apache.org/licenses/LICENSE-2.0
 //
 // Unless required by applicable law or agreed to in writing, software
 // distributed under the License is distributed on an "AS IS" BASIS,
 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 // See the License for the specific language governing permissions and
 // limitations under the License.

 // Copyright 2012 - Gonzalo Iglesias, Adrià de Gispert, William Byrne

 #ifndef TASKDATA_HPP
 #define TASKDATA_HPP

 namespace ucam {
 namespace hifst {

 class HifstTaskData {
   typedef fst::LexicographicArc< fst::StdArc::Weight, fst::StdArc::Weight> Arc;
   typedef fst::LexicographicWeight<fst::StdArc::Weight, fst::StdArc::Weight>
   Weight;

  public:
   HifstTaskData() :
     sidx ( 0 ),
     grammar ( NULL ),
     ssgd ( NULL ),
     cykdata ( NULL ),
     stats ( new ucam::fsttools::StatsData ),
     translation ( NULL ) {
   };

   uint sidx;
   const GrammarData *grammar;

   unordered_map<std::size_t, std::string> oovwmap;

   std::string originalsentence;
   std::string tokenizedsentence;
   std::string sentence;

   std::vector<std::string> pinstances;

   unordered_map<std::string, std::vector< pair <uint, uint> > > hpinstances;

   SentenceSpecificGrammarData *ssgd;

   unordered_set<std::string> tvcb;

   CYKdata *cykdata;

   boost::shared_ptr<ucam::fsttools::StatsData> stats;

   std::string *translation;

   unordered_set<std::string> *recasingvcblm;

   unordered_map<std::string, ucam::util::WordMapper *> wm;

 };

 }
 }  // end namespaces
 #endif

ucam::fsttools::StatsData
Contains data for statistics, i.e. allows timing actions and methods called during execution...
Definition: data.stats.hpp:88

ucam::hifst::HifstTaskData::oovwmap
unordered_map< std::size_t, std::string > oovwmap
Contains oovs.
Definition: data-main.createssgrammar.hpp:52

ucam::hifst::CYKdata
Data structure containing all cyk-related information.
Definition: data.cykparser.hpp:34

ucam::hifst::HifstTaskData
Data class containing relevant variables. To be used as template for task classes using it...
Definition: data-main.createssgrammar.hpp:31

ucam::hifst::HifstTaskData::wm
unordered_map< std::string, ucam::util::WordMapper * > wm
Wordmap/Integer map objects.
Definition: data-main.createssgrammar.hpp:85

ucam::hifst::HifstTaskData::stats
boost::shared_ptr< ucam::fsttools::StatsData > stats
To collect statistics across the whole pipeline.
Definition: data-main.createssgrammar.hpp:76

ucam::hifst::GrammarData
Struct containing grammar rules.
Definition: data.grammar.hpp:42

ucam::hifst::HifstTaskData::recasingvcblm
unordered_set< std::string > * recasingvcblm
mixed-case vocabulary of the recasing unigram language model
Definition: data-main.createssgrammar.hpp:82

ucam::hifst::HifstTaskData::translation
std::string * translation
Translated sentence will be stored here.
Definition: data-main.createssgrammar.hpp:79

ucam::hifst::HifstTaskData::originalsentence
std::string originalsentence
source sentence
Definition: data-main.createssgrammar.hpp:55

ucam::hifst::HifstTaskData::sidx
uint sidx
Sentence index.
Definition: data-main.createssgrammar.hpp:44

ucam::hifst::HifstTaskData::grammar
const GrammarData * grammar
Contains translation grammar.
Definition: data-main.createssgrammar.hpp:49

ucam::hifst::HifstTaskData::tokenizedsentence
std::string tokenizedsentence
Definition: data-main.createssgrammar.hpp:56

ucam::hifst::HifstTaskData::hpinstances
unordered_map< std::string, std::vector< pair< uint, uint > > > hpinstances
Definition: data-main.createssgrammar.hpp:64

ucam::hifst::HifstTaskData::sentence
std::string sentence
Definition: data-main.createssgrammar.hpp:57

ucam::hifst::HifstTaskData::pinstances
std::vector< std::string > pinstances
Pattern instances.
Definition: data-main.createssgrammar.hpp:60

ucam::hifst::SentenceSpecificGrammarData
Structure for sentence-specific grammar Rules will be queried by cyk per position and number of eleme...
Definition: data.ssgrammar.hpp:38

ucam::hifst::HifstTaskData::tvcb
unordered_set< std::string > tvcb
Target vocabulary.
Definition: data-main.createssgrammar.hpp:70

ucam::hifst::HifstTaskData::ssgd
SentenceSpecificGrammarData * ssgd
Sentence-specific grammar information – hashes to rule indices.
Definition: data-main.createssgrammar.hpp:67

ucam
Definition: bleu.hpp:14

ucam::hifst::HifstTaskData::HifstTaskData
HifstTaskData()
Definition: data-main.createssgrammar.hpp:37

ucam::hifst::HifstTaskData::cykdata
CYKdata * cykdata
cyk data structures
Definition: data-main.createssgrammar.hpp:73